欢迎光临散文网 会员登陆 & 注册

非肿瘤纯生信如何轻松发4分+?可以看看免疫细胞+机器学习诊断模型思路!还有获取免疫

2023-03-14 19:00 作者:尔云间  | 我要投稿

要说到免疫细胞,那可有太多种了,巨噬细胞、中性粒细胞、树突状细胞、T细胞…T细胞还分为CD8+T细胞和CD4+T细胞,CD4+T细胞还分为Treg、Th17等等。

这些免疫细胞都能进行生信分析,可以选择单一免疫细胞,也可以选择多个免疫细胞共同分析,而且肿瘤和非肿瘤疾病都可以分析~

(没有思路、不知道怎么创新的找小云,超多个性化的分析思路供你选择哦!)

还可以基于免疫相关基因进行分析,那么免疫相关基因集合如何获取?

可以从数据库中下载,比如MSigDB。

今天番茄君再教你一个方法,就是先基于免疫细胞的组成进行疾病分型,分析两个亚组间的差异表达基因作为免疫相关基因!

接下来通过一篇纯生信文章实操一下吧~

题目:新生儿脓毒症中与免疫细胞相关的特征生物标志物的鉴定和验证

杂志:European journal of medical research

影响因子:4.981

发表时间:2023年2月

数据信息

研究思路

从GEO数据库下载新生儿脓毒症(NS)相关数据,鉴定差异表达基因(DEGs),并进行基因集富集分析(GSEA)以确定其生物学功能。确定了免疫细胞的组成,确定了两个集群之间的免疫相关基因(IRG),并确定了它们的代谢途径。机器学习算法筛选生物标志物。基于所选择的生物标志物构建逻辑回归模型,并对诊断模型进行验证。

主要研究结果

1. 新生儿脓毒症(NS)中的基因表达特征

分析NS与正常样本之间基因表达的差异(图1A)。与正常样品相比,NS样本中发现了52个DEGs,其中大部分表达上调(图1B-C)。通过GSEA分析DEGs的功能通路,在急性炎症反应、巨噬细胞激活调控等方面明显富集(图1D)。

图1.基因表达特征

2. NS的免疫学特征

为了探索NS患者的免疫微环境,对免疫细胞进行了量化。NS患者大部分浸润免疫细胞表现出显著差异(图2A),这也通过层次聚类分析(图2B)和t-SNE图(图2D)得到证实。

图2.免疫细胞微环境特征

3. 两个免疫相关聚类的基因表达特征

UMAP图显示,按免疫细胞组成划分的两个聚类之间的基因存在显著差异(图3A)。与正常样本相比,共检测到54个免疫相关基因(IRG) (图3B-C)。GSEA显示IRG在免疫应答激活、巨噬细胞激活和调节T细胞激活方面的功能显著增强(图3D)。

图3. 两个免疫相关聚类的基因表达特征

4. 构建基于DEG和IRG的诊断模型并验证

采用随机森林方法基于20个DEGs和15个IRGs构建诊断模型(图4A和B)。使用LASSO算法分别基于5个DEGs和1个IRGs构建两个诊断模型。计算每个患者的风险评分,基因特征的风险评分在两种模型中都能较好地预测患者的诊断(图4C-D)。

图4. 构建基于DEG和IRG的诊断模型

在2个验证数据集中评估了两种诊断模型的有效性。这两种模型都适用于验证数据集1(图5A, B),并且IRG模型在验证数据集2中比DEG模型更好,因为它只有一个基因签名(图5C, D)。

图5. 评价基于DEG和IRG的NS诊断模型评价

 

总结

这篇文章最大的亮点就是获取免疫相关基因的方法:先基于免疫细胞的组成进行疾病分型,分析两个亚组间的差异表达基因作为免疫相关基因! 

另外,作者还同时基于DEG和IRG构建了2个诊断模型,分析内容很简单。纯生信思路就可以轻松发4分+,性价比还是很高的~从分析方法上找创新效果超赞!

如果你还苦恼于课题或分析没有思路,或者对免疫等热点方向感兴趣的小伙伴快来联系小云吧!


非肿瘤纯生信如何轻松发4分+?可以看看免疫细胞+机器学习诊断模型思路!还有获取免疫的评论 (共 条)

分享到微博请遵守国家法律