最新6分+非肿瘤的免疫浸润纯生信思路!3种机器学习算法齐上阵,筛选线粒体自噬相关诊

你见过如此简单的分析流程图吗?
2个月就接收的6分+纯生信!
只能说“线粒体自噬”这个热点牛!

“我是细胞的,属于细胞器,细胞器老大,叫做线粒体。
能量代谢中心,专注生产ATP,关联多种疾病,延伸方向很广。
研究现状是这样的:论文发表强劲,数量逐年递增。国自然立项攀升,研究热点坐实,地位不言而喻,神一样的存在!”

可是万万没想到,研究线粒体的其中一个切入点——线粒体自噬,要比线粒体本身的热度还高!不信看图:

线粒体自噬是一种线粒体质量控制机制,在缺氧和代谢应激等的作用下被激活,通过选择性地清除掉功能障碍的线粒体维持细胞内环境的稳定。
近年来,线粒体自噬已经成为国自然的热点方向之一,相关的发文数量和国自然中标数量逐年增长,而且线粒体自噬参与了多种疾病的发生发展(言外之意就是多种疾病都可以分析线粒体自噬~)
(心动不如行动~没有思路、不知道怎么创新的找小云,超多个性化、创新性高的分析思路供你选择!)
话不多说,今天小云就借用一篇6分+非肿瘤的纯生信文章,带你看看性价比超高的线粒体自噬分析思路。

题目:鉴定ULK1在糖尿病肾病中作为新的线粒体自噬相关基因
杂志:Frontiers in Endocrinology
影响因子:6.055
发表时间:2023年1月
数据信息

研究思路
从GEO数据库中获取5个数据集,分为训练集和验证集。然后筛选差异表达的线粒体自噬相关基因(MRGs),并进一步分析GO和KEGG的富集情况。接下来,采用SVM-RFE、LASSO和RF三种机器学习算法对识别hub基因。根据hub基因绘制ROC曲线。然后,使用CIBERSORT算法评估了22种免疫细胞的浸润,并分析了hub基因与免疫细胞之间的相关性。最后,使用Nephroseq V5工具分析DN患者中hub基因与GFR的相关性。

分析流程图
主要研究结果
1. 糖尿病肾病(DN)中分析差异表达的线粒体自噬相关基因(MRGs)
29种MRGs的相互作用如图1A所示。从PCA图可以看出,归一化后两个样本组的聚类更加明显,说明样本来源是可靠的(图1B、C)。在肾小球样品中鉴定出18个MRG, 12个基因在DN和健康对照组之间表现出显著的表达差异(图1D)。在小管间质样品中鉴定出的18个MRG中只有5个表达存在差异(图1E)。在肾小球样本中观察到最显著的差异,因此选择肾小球样本进行进一步研究。


图1. DN中线粒体自噬相关基因分布
图2A显示了12个DE-MRGs的表达,但在肾小球样本中只有MFN1基因上调,其他基因均下调。图2B的热图显示了DE-MRGs在肾小球样品中的表达。在相关性分析中发现这些基因密切相关(图2C),表明它们可能共同发挥作用。

图2. DN中线粒体自噬相关基因的方差分析。
2. DE-MRGs的GO和KEGG分析
GO富集结果发现巨自噬、自噬、线粒体自噬、蛋白跨膜转运蛋白活性和泛素蛋白连接酶结合显著富集(图3A-B)。在KEGG分析中,DE-MRGs主要参与线粒体自噬和神经退行性变-多种疾病的通路(图3C, D)。

图3. 12种DE-MRGs的GO富集和KEGG分析
3. hub基因的鉴定
使用三种不同的机器学习算法构建DN诊断的预测模型。使用LASSO算法筛选出7个基因(图4A, B)。基于SVM-RFE确定5个基因作为DN的最佳候选基因(图4C, D)。使用随机森林选择前8个基因作为诊断基因(图4E,F)。将从SVM-RFE、LASSO和RF模型中获得的候选基因取交集获得3个hub基因(图4G)。


图4. 3个DE-MRGs被鉴定为DN的诊断基因
4. 训练集和验证集中hub基因诊断糖尿病肾病的表现
在训练集中,与对照组相比,MFN1在DN中显著过表达,ULK1和PARK2在DN中表达降低(图5A-C)。ROC曲线显示MFN1的AUROC为0.839,特异性为95.8%,敏感性为71.1%(图5D,G)。ULK1的AUROC为0.906,敏感性和特异性分别为95.8%和73.7%(图5E,G)。PARK2的敏感性、特异性和AUROC分别为87.5%、71.1%和0.842(图5F, G)。

图5. 训练集中三个hub基因诊断DN的表现
图6显示了验证集中三个有线粒体自噬相关hub基因在DN诊断中的价值。ROC曲线显示ULK1在DN诊断中表现优异,AUROC为0.894(图6E)。

图6. 验证集中三个hub基因诊断DN的表现
6. 免疫浸润分析
使用CIBERSORT算法评估DN的免疫浸润。PCA聚类分析显示,DN和对照样品在免疫细胞浸润方面存在巨大差异(图7A)。使用par函数计算免疫细胞百分比并绘制堆叠直方图(图7B)。通过绘制相关热图评估22种免疫细胞浸润之间的相关性(图7C)。从22种免疫细胞浸润差异的小提琴图(图7D)可以看出,与对照样品相比,DN中的γδT细胞、M1巨噬细胞、M2巨噬细胞和静息肥大细胞浸润率较高,而静息CD4记忆T细胞、活化肥大细胞和中性粒细胞浸润率较低。

图7. 免疫细胞浸润的评估和可视化
6. ULK1与浸润免疫细胞的相关性分析
根据免疫细胞浸润情况,ULK1的表达与中性粒细胞呈正相关,而与M1巨噬细胞和M2巨噬细胞呈负相关(图8)。

图8. ULK1与浸润免疫细胞的相关性分析
9. ULK1与肾功能的临床相关性
利用Nephroseq数据库进行ULK1与GFR的相关性分析(图9)。ULK1与GFR呈正相关,提示ULK1可能对DN具有保护作用。

图9. ULK1表达与肾功能(肾小球滤过率)的关系散点图
总结
这篇文章的创新点是利用3种机器学习算法筛选出关键的线粒体自噬相关基因,作为疾病的诊断基因,并分析了免疫细胞浸润。没有做实验,只是基于在线数据库Nephroseq验证了关键基因与肾功能的关系。
肾病数据库(Nephroseq)结合了丰富的公开可用的肾脏基因表达谱,专为数据挖掘和基因表达数据的可视化而设计。与肾脏相关的疾病可以充分利用起来哦~
而且从分析的结果看,还与免疫细胞有关,也就是说这个分析思路除了可以发文章,还可以根据分析结果设计后续的细胞和动物实验,完全可以作为国自然的课题思路哦!
关联线粒体自噬这个国自然热点方向,即使超简单的分析内容也能轻松发表6分+纯生信文章~
如果您想设计线粒体自噬或者其他方向的生信分析思路,但是时间和精力有限,小云可以提供如下服务:免费评估服务、付费设计服务、定制化生信分析等。超多个性化、创新性高的分析思路供你选择!欢迎咨询小云哦!
