双疾病分析的典型模式:新冠病毒感染与其并发症/SCI论文/科研/研究生/生信分析热点思

正值阳过/阳康/王重阳时,这时的纯生信分析岂非应情应景
新冠肆虐,正值大家疯狂玩梗、苦中作乐之时,小云虽嗅不出什么商机,但是对生信分析的老本行却非常敏感,可以大胆预测一波,新冠病毒相关的生信挖掘思路必然会伴随而来。

过去新冠患者偏少,且限于安全性等问题,不少科研工作者接触不到足够的患者临床数据。那么现在,伴随着新冠的大范围发生,相信各个医院手头都有不少患者的新冠感染临床数据,这刚好可以用作后续的各种分析和挖掘。
小云曾多次分享过“双疾病分析”这个点,并且对其优势大书特书,有感兴趣的粉丝也可以翻翻小云的往期文章。“双疾病分析”分析的关键是能获得两种有相关性的疾病,那么新冠病毒感染及其并发症则刚好满足这个特征,比如小云检索发现,根据当前报道显示,新冠感染可能和如下疾病有关:
一、呼吸窘迫综合征,表现为呼吸困难、缺氧、紫绀、呼吸衰竭。
二、脓毒症,表现为高热,伴有全身的感染中毒症状,严重者可以出现休克、死亡。
三、凝血功能障碍,血管内可以出现血栓形成,出现DIC,可以表现为皮肤的瘀点、瘀斑,严重者可以出现腔道出血。
四、心肌炎,可以表现为心律失常、心肌酶升高,严重者可以出现心功能衰竭。
五、并发肝损伤,表现为肝生化的异常。
六、可以并发急性肾损伤,表现为蛋白尿、血尿、少尿,严重者可以出现急性肾衰。
七、可以并发脑膜炎,有个别病例报道可以并发脑膜炎,表现为头疼、呕吐、脑膜刺激征。
八、继发细菌、真菌等感染
那么,具体如何进行分析了?我们就具体分享一篇8+的纯生信分析的新冠病毒感染与其并发症相关文章,进行示例展示,方便大家复现。(如果没有分析思路或者文献复现有困难,可以找小云,超多创新性高的分析思路和分析服务供你选择!)

题目:整合生物信息学分析筛选新冠肺炎相关慢性荨麻疹的潜在关键生物标志物
杂志:Front Immunol
影响因子:IF=8.8
发表时间:2022年12月

研究思路
分别用CU(chronic urticaria)数据集GSE72540和COVID-19数据集GSE164805作为训练集,GSE57178用于验证数据。筛选出CU和COVID-19所共有的差异基因(DEGs)后,再进行基因富集分析、WGCNA、PPI网络和免疫浸润分析。此外,机器学习LASSO回归筛选出关键基因。最后,构建关键基因的网络分析、基因-转录因子-miRNA-lncRNA调控分析和药物-基因分析,并利用RNA表达谱数据进行结构验证(如下图)。

分析结果
1. 获取COVID-19和 CU(chronic urticaria)共享的差异表达基因
图2A、B显示COVID-19数据集GSE72540和CU数据集GSE164805中的基因标准化;火山图所示GSE72540中1033种不同表达的mRNA(DEmRNA)以及GSE164805中的6705个DEmRNA(如图2C、D)。热图显示了100个DEmRNA(图2E、F中)。最终识别出322个CU和COVID-19共享的DEGs。


图2 COVID-19和 CU(chronic urticaria)共享的差异表达基因
2. 鉴定疾病相关的关键模块
WGCNA分析用于识别CU相关的五个基因模块(棕色、蓝色、青绿色、绿色和黄色)。动态树切割算法展示分析结果(图3A)及其相关性如图3B所示。棕色、蓝色和青绿色模块的基因与CU呈正相关,绿色和黄色模块基因与CU呈负相关(图3C)。通过in-depth计算识别颜色模块与基因意义的关联性,发现绿色模块和基因显著性为0.85(P值=1.7E-3)(图3D)。

图3与疾病特征相关的基因模块鉴定
3. PPI网络构建
为了探索上述共同差异表达基因的相互作用关系,我们将建立WGCNA识别出的关键基因,利用STRING工具进行PPI网络构建。网络中总共有54个节点和168个边缘(图4A)。最具关联性的前30个基因PPI网络如图4B所示。作者挑选出了2个模块。其中一个有9个节点和36条边(图4C),而另一个有七个节点和13条边(图4D)。

图4 差异基因的ppi网络构建
4.差异基因的hub基因获取
通过整合的生物信息学分析,鉴定出9个hub基因,包含CD86、FCGR3A、AIF1、CD163、CCL4、TNF、CYBB、MMP9和CCL3(图5A-B)。进一步探讨hub基因的作用功能。如图5C所示,hub基因参与单核细胞的免疫调节迁移、2型免疫反应的调节和阳性单核细胞迁移的调节。同时,病毒蛋白与细胞因子和细胞因子受体、Toll样受体的相互作用信号通路和IL-17信号通路仍然是主要的富集途径(图5D)。

图5 差异基因的hub基因获取及功能分析
5. 双疾病相关的关键基因获得及预后模型构建
LASSO回归分析鉴定出3个关键基因FCGR3A、CCL3和TNF(图6A-B);利用ROC曲线评估每个基因的诊断特异性和敏感性,在训练集GSE72540的分析结果如下:FCGR3A(曲线下面积(AUC)0.9625,P值=0.0010),TNF(AUC 0.9375,P值=0.0019)和CCL3(AUC 0.95,P值=0.0019)(图6C),表明3个基因均具有较好的预测能力。

6. 两种疾病的免疫浸润相关分析
利用CIBERSORT算法研究CU和COVID-19免疫浸润,结果发现CU和COVID-19中22个免疫细胞的比例为如图7A、B所示。如图7C所示,相关性CU中每种免疫细胞的相关性分析表明肥大细胞活化与树突状细胞显著相关;如图7D所示,巨噬细胞M0与CD8T细胞、B细胞记忆、原始B细胞等显著相关。

图7 两种疾病的免疫浸润相关分析
7. 英夫利昔单抗可能是新型冠状病毒相关肺炎合并CU的潜在治疗药物
为了给新型冠状病毒肺炎并发CU提供特异性治疗药物,作者通过DGIdb工具开发了关键基因-药物-相互作用网络。如图8A所示,共筛选了87种的可能药物,只有INFLIXIMAB可以同时靶向所有关键基因。然后,我们预测了它们的分子结合位点,图8B显示了CCL3与INFLIXIMAB的结合模式,图8C显示了TNF与INFLIZIMAB的关系,图8D显示了FCGR3A与INFLIXIIAB的关系。

图8 新型冠状病毒相关肺炎合并CU的潜在治疗药物筛选
文章小结
这篇文章是以新冠肺炎合并CU疾病为研究对象,利用了双疾病相关的分析思路进行的一篇非肿瘤数据挖掘研究。其具体的分析思路与常见的双疾病研究并无显著差异,所以我们更换双疾病方向则可以进行数据复现。
特别是当前新冠病毒传播广泛,且相关并发症较多,除了文首提到的8类并发疾病之外,基于临床数据统计出的新潜在疾病也可以作为备选项。因此,如果对新冠疾病感兴趣,换个并发症就可以复现一篇文章,暂时还未做这方面分析的,那么赶紧动手吧,抓紧复现。
小云悄悄话
如果你还苦恼于生信没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对新的热点方向感兴趣的小伙伴快来联系小云吧。
小云可以提供如下服务:免费评估服务、付费设计服务、定制化生信分析等。超多个性化、创新性高的分析思路供你选择!
“新冠”生信思路持续上新!利用Th2细胞关键基因进行药物筛选,最简单的纯生信分析就能发6分+,性价比简直了!
双疾病生信分析又出新思路——利用“新冠病毒相关基因”构建肿瘤预后模型,7分+简直完美,趁着这波热潮抓紧上车!!
当生信分析邂逅新冠病毒,超简单的分析就能发5分+文章!我仿佛看到了生信的无限魅力!
6分+非肿瘤顶流“COVID-19”纯生信WGCNA思路,分析方法简单超乎想象,再不上车就晚啦!!
