欢迎光临散文网 会员登陆 & 注册

无代码实现WGCNA分析(二)

2022-11-01 20:27 作者:生信小院  | 我要投稿


WGCNA分析作为近年来比较热门的一种分析方法,已经在许多实验中得到了应用,相关的文章也发表在nature communications、plant physiology、the plant journal等国际知名的植物学期刊。但是对于许多无生信基础的人而言,如何理解并实施WGCNA分析却成了一个让人头疼的问题。因此,为了解决这一难题,本公众号在上一篇推文无代码实现WGCNA分析(一)中详细介绍了如何用WGCNA实现样品聚类图的绘制、最合适的power值的确定、自动网络结构和模块的构建、基因与模块间的相关性的建立以及Cytoscape网络的导出(Cytoscape图的绘制参考之前的推文Cytoscape操作指南)。虽然,对于一些实验而言,这些分析可能已经足够。但是,对于希望能够筛选到一些重要的关键基因(hubgene),将文章的档次再提高那么一点点,或者为接下来的实验作一个更好的铺垫,目前的WGCNA分析深度远远不够。因此,为了完成这一目标,我们将在接下来的篇幅中重点介绍如何通过WGCNA挖掘关键的hubgene。

前面的步骤(第一步到第八步)可以参考无代码实现WGCNA分析(一)实现,接下来,我们代码将沿着无代码实现WGCNA分析(一)的步骤继续分析下去。

第九步:探讨基因、模块、性状三者间的关系,并导出重要的hubgene

9.1 计算各个基因与各个模块间的内在联系。

其中,power_value的值选自于之前计算的值。基于power_value的基础上分别计算所有基因与每个模块的关联性也就是KME值,即每个基因相对于每个模块特征值的有符号特征值连通性。

9.2 利用性状数据,计算每个样本与性状的关系。

9.3 绘制基因与合并模块之间显著性的柱状图(图1),再生成由相关性、p值和回归线注释的散点图(图2)。

注意:这里图二包含每个模块生成的一张图,但是本推文仅展示一个模块生成的图。

经由此步,脚本会生成图1和图2。


图1
图2

9.4 筛选hubgene

筛选hubgene的方法并不固定,每个分析者都可以根据自己的要求,设定相应的阈值去筛选。这里,我们仅介绍两种筛选hubgene的方法。

(1)直接根据基因与指定性状的直接相关性、所属模块身份和加权相关性去筛选基因。

(2) 先基于KME和KME_pvalue去找到所有的hub基因,后基于在无代码实现WGCNA分析(一)第8.3部分计算得到的性状与模块相关性数值,找到关键的hub基因。

首先,利用cor函数和corPvalueStudent函数计算KME的pvalue,并输出相应的文件(文件非必须输出)。

其次,分不同的模块抽取出其KME和KIM的值,再将其合并起来。

最后,先基于上一步计算得到的KME和KME_pvalue与筛选所有的hub基因,后基于性状与模块的相关性,找到关键的hub基因。

最后,完成所有的WGCNA分析,挖掘出关键的hubgene。


三 惯例小结


本公众号开发的相关软件,Multi-omics Hammer软件和Multi-omics Visual软件欢迎大家使用。文末是本公众号在其他平台的账户,也欢迎大家关注并多提意见。


简书:WJ的生信小院

博客园:生信小院

公众号:生信小院


最后,也欢迎各位大佬能够在本平台上:1传播和讲解自己发表的论文;2:发表对某一科研领域的看法;3:想要达成的合作或者相应的招聘信息;4:展示自己以寻找博后工作或者博士就读的机会;5:博导提供博后工作或者博士攻读机会,都可以后台给笔者留言。希望本平台在进行生信知识分享的同时,能够成为生信分析者的交流平台,能够实现相应的利益互补和双赢(不一定能实现,但是梦想总得是有的吧)。


无代码实现WGCNA分析(二)的评论 (共 条)

分享到微博请遵守国家法律