双疾病升级版之非肿瘤泛癌分析!WGCNA筛选免疫细胞相关基因+机器学习,如此简单的纯生

肿瘤的泛癌分析已经很常见了,但是你知道非肿瘤疾病也能做泛癌分析吗?
肿瘤和非肿瘤疾病均与免疫细胞相关,以此为桥梁岂不是将非肿瘤疾病与肿瘤联系起来了吗?

双疾病是一种性价比很高的生信分析思路,不仅非肿瘤之间可以用,非肿瘤和肿瘤之间也可以用。
但这句话说的并不全面,应该加一句:不仅单个非肿瘤疾病与单个肿瘤之间可以用,就连单个非肿瘤疾病与多个肿瘤之间也可以用。。。
因为非肿瘤疾病也能做泛癌分析!!!

(没有思路、不知道怎么创新的找番茄君,超多个性化的分析思路供你选择!)
今天给大家分享的这篇文章有3个亮点:
(1) 使用WGCNA结合免疫浸润分析,识别类风湿关节炎(RA)中与CD8+T细胞相关的差异基因;
(2) 利用机器学习筛选关键基因;
(3) 针对CD8+T细胞相关的关键基因进行泛癌分析。
让我们看看这篇文章具体是如何进行分析的。

题目:类风湿关节炎中CD8+T细胞相关生物标志物的鉴定及其泛癌分析
杂志:Frontiers in immunology
影响因子:IF=8.786
发表时间:2022年11月

研究思路
通过多个类风湿关节炎(RA)数据集、CIBERSORT和WGCNA算法,筛选出与RA中CD8+T细胞相关的基因。进一步利用机器学习分析确定与RA最密切相关的CD8+T细胞基因。分析三个关键基因与33种癌症之间的关系。针对关键基因的相关性分析、转录因子分析、单基因GSEA和PPI网络的构建。
主要研究结果
1. WGCNA筛选与CD8+T细胞相关的hub模块,并进行功能富集分析
使用CIBERSORT分析GEO中RA相关数据集,确定数据集中每个样本中各种免疫细胞亚型的百分比。然后选择7个T细胞亚型的比例作为WGCNA的特征数据。采用WGCNA构建基因共表达网络,计算平均关联系数和Pearson相关系数,对数据集中所有样本进行聚类分析。将功能相同的模块组合成一个大模块,形成37个模块。
在37个模块中,蓝色模块与CD8+T细胞的关系最为显著。因此,将蓝色模块作为hub模块。从中筛选出10个关键基因。然后对蓝色模块中的基因进行GO和KEGG分析。

图1.模块-性状相关性和功能富集分析
2. hub基因的筛选与验证
对上述10个关键基因进行LASSO和随机森林(RF)分析,通过LASSO分析共获得6个基因。从RF分析结果中选取重要度为0.6的7个基因。用维恩图(Venn diagram)对LASSO和RF的交集基因进行可视化,共得到4个关键基因。

图2. Hub基因的筛选
用5个GEO验证数据集验证4个关键基因(CD8A、TNS3、GZMA、PRF1)水平与CD8+T细胞浸润之间的相关性。发现其中三个基因与CD8+T细胞浸润程度呈显著正相关。

图3.在三个不同的数据集中hub基因表达与CD8+T细胞浸润水平的散点图
3. 关键基因的泛癌分析
采用CIBERSORT、McP-counter、QUANTISEQ、TIMER、XCELL等方法分析关键基因在不同癌症中与CD8+T细胞浸润的关系。发现3个关键基因在各种恶性肿瘤中与CD8+T细胞浸润呈正相关。说明所鉴定的hub基因在肿瘤免疫微环境中起着重要作用,并与CD8+T细胞浸润程度高度相关。

图4. 不同癌症中CD8A表达水平与CD8+T细胞浸润程度的关系
4. Hub基因的相关性分析
在不同数据集中验证了hub基因之间的相关性,发现CD8A、GZMA、PRF1三者之间存在显著正相关。

图5. 3个hub基因在3个不同基因集中表达水平的关系
然后检测CD8A、GZMA和PRF1在各种恶性肿瘤中的关系。除THYM、CD8A和GZMA在所有肿瘤中呈正相关外,CD8A和PRF1在33种肿瘤中呈正相关,GZMA和PRF1在33种肿瘤中呈正相关。正常组织分析结果显示,CD8A与GZMA在各正常组织中呈正相关,GZMA与PRF1在各正常组织中呈正相关,CD8A与PRF1在骨髓中呈负相关,其余均呈正相关。

图6. 三个hub基因表达水平的关系:(A-C)在不同的癌症类型;(D-F)正常组织
5. 转录因子分析
从CHEA3数据库中分析出与CD8A、GZMA和PRF1相关的8种常见转录因子。

图7. CHEA3数据库中Hub基因的转录因子预测
6. 单基因GSEA
为了探究hub基因的功能,进行单基因GSEA分析。结果发现CD8A主要富集于类风湿关节炎、哮喘、胆固醇代谢等(图A)。GZEA主要富集在胆固醇代谢、类固醇生物合成等方面(图B)。PRF1主要富集在冠状病毒病COVID-19、磷酸戊糖途径和亚油酸代谢中(图C)。


图8. hub基因的GSEA分析
7. 分析hub基因的相互作用
利用GeneMANIA数据库建立Hub基因的PPI网络,构建了一个20个基因相互作用网络。并分析了20个基因的功能富集情况。基因主要富集在T细胞介导的免疫、修饰等,并可能调控原发性免疫缺陷、病毒蛋白与细胞因子的相互作用以及细胞因子受体。说明这些基因对免疫系统至关重要。

图9. Hub基因互作分析
总结
这篇文章并没有特别复杂的分析内容,也没有实验验证,简单的分析思路就发到8分+,性价比超高!
看完这篇文章是不是发现,原来非肿瘤疾病也能做泛癌分析!那么以此为套路,换一种疾病进行分析,岂不又是一篇文章?
非肿瘤疾病既可以做双疾病,也可以基于免疫细胞相关基因进行生信分析,还能做非肿瘤疾病的泛癌分析。。。能做的分析思路有多了一种选择!
如果你也想进行非肿瘤疾病的泛癌分析或者基于免疫细胞相关基因进行分析,欢迎咨询番茄君哦!小云可以提供:免费评估服务、付费设计服务、定制化生信分析等。超多个性化、创新性高的分析思路供你选择!
