WGCNA分析结果图怎么看?小云带你来读图!(下篇)/SCI论文/科研/研究生/生信分析热点

上篇中小云带领小伙伴们解读了Power图和cluster dendrogram图(聚类树状图)(ps:没有看到的朋友可以点击文末链接观看哦)
下面就继续跟着小云看我们在生信文章中最关注的WGCNA结果如——module-trait-relationship(模块与表型特征关联图谱)和MM-GS相关性图。(ps:结果图解读过程中会涉及到一些WGCNA分析中的关键术语,不理解术语的朋友可以点击文末链接观看WGCNA术语介绍文章)

p Module-trait-relationship图
n 先回顾下Module的意义,它本质是高度内连的基因集,模块内是高度相关的基因。在WGCNA分析中把基因聚类成模块后,对每个模块进行了功能富集分析、模块与性状进行关联分析和模块与样本进行关联分析,分别可以去查找基因的功能特征,筛选出表型与性状(比如肿瘤进展、预后良好、转移、xx疾病等)关联较高的的模块和查找样本中特异表达基因。

Module-trait-realtionship是模块与表型特征关联图谱,也是WGCNA中我们最关注的结果。横坐标是表型性状(trait),上图中显示有两个表型性状,一个是Control,另一个是COVID-19。纵坐标是对应模块,用每个模块的特征基因(eigengene)来表示这个模块(ps:回顾一下,eigengene代表的是每个模块的第一主成分)。在上图中有10个模块,分别用不同颜色表示。格子代表横坐标的表型性状和纵坐标的每个模块的相关性以及p-value值,黄的越深,越正相关;蓝色越深,越负相关。最右边的图例,代表的是相关性,越接近1黄色越深,代表正相关,越接近-1蓝色越深,代表负相关。根据上图可以看出分析得到的10个模块中,MEpink(r = 0.57,P = 4E−20)、MEtan(r = 0.33,P = 6E−07)与COVID-19的相关性较高。
p MM-GS相关性图
模块与指定性状的相关性我们已经分析得到了,但是一个模块通常有很多基因。我们如何找到最相关的基因呢?WGCNA通过GS和MM给出了一个合理的解决办法。
首先我们将模块中的每个基因与eigengenes进行相关性分析,得到的结果就是module membership(MM)。当结果越接近于0,则我们认为该基因与其所在的模块越不相关。而结果越接近于1或者-1,则我们认为该基因与模块基因高度正或负相关。此外,MM与模块内的连通性是高度相关的,所以高连通性的hub genes倾向于有更高的MM值。
模块内的基因,我们不仅想知道它与模块的相关性,还想知道它与模块对应的性状的相关性。于是WGCNA定义了一个新的变量GS (gene significance),即计算模块内gene 与对应性状的显著性。

MM-GS相关性散点图代表的是MM与GS的相关性,从上图我们可以看到,GS和MM相关性很高(cor=0.79,p<1 × 10−200),这表明与性状高度相关的基因,通常也是该性状对应模块内比较重要的基因。因此当我们选择感兴趣的重要基因时,推荐选取散点图右上角部分的基因。
本次WGCNA分析结果图的分享就到这里啦,觉得有用的朋友可以码住备用哦!
小云之声
如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和思路设计有所需要的话,“生信鸟”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及实验项目实施等,有意向的小伙伴欢迎咨询小云哦!
