生信分析中的GSEA图谱看不懂?看这里
尔云间 一个专门做科研的团队

小伙伴们,大家好呀,很高兴和大家见面,最近看到有果粉提问关于GSEA图谱的问题,之前呢有写过关于其它图谱的分析,如果有小伙伴需要,可直接在往期里面查找就可以了,今天呢我们来聊聊关于如何进行GSEA读图。
内容分为两部分:
一是GSEA分析是什么?
二是GSEA图谱解读。
走神的,还没有准备好的小伙伴快来看这吧。

一、GSEA分析是什么?
GSEA:是基因集富集分析,全称为Gene Set Enrichment Analysis,它是用来评估基因集中基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。通俗的来讲就是判断此基因集内基因的协同变化对表型变化产生的影响。
二、GSEA图谱解读
在分析进行图谱解读前我们首先看看GSEA图谱长什么样,大概就是像下图这样的。左图是富集一条通路上的情况,右图是富集到多条通路上情况。

实际情况中小伙伴遇到的富集通路可能比较多,小果在这里为了方便解读选择富集到一条通路上的图谱进行解读。
当小伙伴拿到这样一张图时,看到这是一张复合图,由Enrichment score折线图、基因排列和rank值得分布图组成。在拿图时小伙伴们别被它吓到,首先去了解下横纵坐标表示的什么。左图中横坐标的名称是Rank in Ordered DataSet,代表的是数据集的排序值。纵坐标有两个,一个是Enrichment score,代表的是富集分数,另一个是Ranked list metric,代表的是基因排序量。
这样的话我们就先来看第一部分的Enrichment score折线图:它展示的就是基因集中基因按排序计算时,富集分数在计算到每个位置时的展示。可以在图中看到曲线有个最高峰,该处的得分就是是基因集的富集评分,位于最高峰前的的基因就是核心基因。
第二部分:基因集中基因排列的情况图,即图中红色的的竖线排列情况情况,还可以看到红色竖线中有SPLICEOSOME(ES=0.5179,NP=0.0040),这是富集到的通路名称SPLICEOSOME,ES代表的就是富集评分,NP就是显著性。
第三部分是排序后所有基因rank值得分布图,图中有L与H两部分,L组中相对对应的基因在中高表达,H组中对应的基因低表达,每个基因对应的信噪比(Signal2noise,前面选择的排序值计算方式)以灰色面积图显展示。
当然小伙伴在实际的分析中可能会遇到多个通路,分析的方法也是一模一样,小伙伴可以使用自己的数据试着分析下,今天的分享就到此结束了,有问题可以给小果留言哦。

推荐阅读
关注小果,小果将会持续为你带来更多生信干货哦。

生信果 生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器等原创内容