生信小白入门级文章!非肿瘤纯生信分析+WGCNA,轻松发到4分+文章!
越来越多的生信分析文章会用到WGCNA分析,WGCNA是描述不同样品之间基因关联模式的系统生物学方法。(ps:布小谷往期的分享有相关解读内容哟!)今天布小谷给大家带来一篇非肿瘤纯生信文章,研究使用WGCNA分析,对生信小白非常友好,思路简单,容易复现。
如果没时间或者需要寻找新方向建议找布小谷,超多个性化的分析思路供你选择哦!

l 题目:通过WGCNA分析鉴定脓毒症关键基因
l 杂志:Preventive Medicine.
l 影响因子:IF=4.673
l 发表时间:2023年7月
研究背景
脓毒症是一种由感染引起的机体异常反应,可导致危及生命的器官功能障碍,并进一步发展为感染性休克,是感染导致死亡的最重要原因。脓毒症指南的发布和实施、重症监护的进步以及对早期诊断和及时干预的认识提高,脓毒症的发病率虽然有所增加,但死亡率正在逐渐下降。但是脓毒症依然对人类健康有威胁,了解脓毒症发病机制和确定潜在的分子治疗靶点非常重要。
数据来源

研究思路
本研究在GEO数据库上,获得两个不同数据集的原始数据,GSE131761和GSE137342。借助limma包识别DEGs。用了WGCNA R包构建共表达网络并识别模块。从两个模块中提取基因进行了基因本体(GO)分析和KEGG分析。选择相互重叠的基因作为关键基因的候选者,使用venn R包鉴定枢纽基因。
主要结果
1.GSE131761数据集中DEGs的鉴定
图1为GSE131761数据集中识别DEGs的结果图。阈值为|log2(差异倍数)|>1和p<0.05,共鉴定出1272个DEGs,包括642个下调基因和630个上调基因。

2.构建GSE131761数据集中相关基因的共表达网络
对GSE131761数据集进行WGCNA分析。对样本进行聚类分析以检测异常值,选择值140作为高度截止值,分析结果表明所有的样本都位于簇中并通过了阈值(图2A)。使用“sft$powerEstimate”确定软功率阈值,采用软阈值功率分析获得网络拓扑的无标度拟合指数,用于对败血症和正常状况进行进一步研究(图2B-C)。使用WGCNA R包的一步法网络构建功能来构建基因网络,并找到其中的模块,对模块进行层次聚类分析,构建了32个基因共表达模块(图2D)。图2E为已识别模块之间的连接图,热图描绘了用于加权共表达网络分析的基因的拓扑重叠矩阵(TOM)。
研究者在脓毒症和模块相关后寻找显著性水平最高的关联,结果表明,浅绿色模块与脓毒症的相关性最显著(图3A)。浅绿色模块的模块均值和基因重要性(GS)具有高度显著的相关性(图3B)。



3.浅绿色模块的功能分析
对浅绿色模块中包含的基因进行GO和KEGG分析。结果表明绝大多数基因富含蛋白质丝氨酸/苏氨酸/酪氨酸激酶活性(图4A),并且除了TNF和HIF-1信号通路之外,浅绿色模块是控制B细胞受体信号通路的模块(图4B)。随后对信号通路进行热图分析(图4C),发现浅绿色模块中的每个基因都对应其中一条信号通路。

4.GSE137342数据集中DEGs的识别结果
图5为GSE137342数据集中识别DEGs的结果。阈值设置为|log2(差异倍数)|>1和p<0.05,发现233个DEGs,其中149个下调基因,84个上调基因。

研究在GSE137342数据集中构建了相关基因的共表达网络。对样本进行聚类分析,观察是否有任何明显的异常值。本研究样本量不受身高限制,临界值设置为200(图6A)。使用函数“sft$powerEstimate”,建立软功率阈值,得到网络拓扑的无标度拟合指数(图6B-C)。对样本进行层次聚类分析,检测具有相应颜色分配的共表达簇,热图描述了用于加权共表达网络分析的基因的拓扑重叠矩阵(TOM)(图6D-E)。


研究寻找模块和脓毒症之间最强的关联,对脓毒症重要模块进行分析。蓝色模块在预测脓毒症方面具有最高水平的意义(图7A)。蓝色模块的GS及其相关基因显示出强的正相关(图7B)。

5.蓝色模块的功能分析
对蓝色模块的部分基因进行GO和KEGG分析。研究结果显示绝大多数基因表现出泛素样蛋白转移酶活性的富集,这可以解释为这些基因在分子水平上发挥的作用(图8A)。蓝色模块调控包括与软病毒疾病相关的氧化磷酸化以及与许多不同疾病相联系的神经退行性通路在内的一些通路(图8B)。图8C为信号通路的热图,显示蓝色模块中的每个基因对应信号网络中的特定通路。


6.脓毒症相关枢纽基因的鉴定
基于蓝色模块中的1938个基因、浅绿色模块中的2898个基因、GSE131761数据集中的1272个DEGs和GSE137342数据集中的233个DEGs,韦恩分析表明2个交集基因,包括锚蛋白重复结构域22(ANKRD22)和vanin1(VNN1),为脓毒症相关枢纽基因(图9)。

文章小结
本文章在分析思路和整体设计上比较简单,对生信新手非常友好。即使是刚入门的朋友也可快速掌握,容易复现。虽然分析内容较为简单,数据量不大,但通过使用WGCNA分析,制作了两个模块,发现了两个枢纽基因,了解脓毒症相关的易感模块和基因。感兴趣的朋友,码住思路开始行动吧!
布小谷之声
如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和思路设计有所需要的话,“生信鸟”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及实验项目实施等,有意向的小伙伴欢迎咨询布小谷哦!
