欢迎光临散文网 会员登陆 & 注册

最新纯生信思路教你如何基于单核细胞髓源性抑制细胞(M-MDSCs)相关基因进行分析!基于

2023-02-19 19:00 作者:尔云间  | 我要投稿


免疫细胞相关基因如何获得?

数据库下载?单细胞数据分析?WGCNA?

看完这篇文章再告诉一个新方法~


基于免疫细胞的相关基因进行生信分析的思路正在走向火热,肿瘤和非肿瘤疾病都可以用哦。

同一种免疫细胞可以换不同的疾病数据集分析;而同一种疾病,换一种免疫细胞进行分析,岂不又是一篇文章?

另外,免疫细胞有很多,不仅可以分析Treg、巨噬细胞、CD8+T细胞、辅助性T细胞(Th细胞),还可以分析单核细胞髓源性抑制细胞(M-MDSCs)!

(能用生信分析解决的问题都不是问题,欢迎来咨询小云,超多个性化、创新性高的分析思路供你选择!)

要基于免疫细胞的相关基因进行生信分析,首先要获取免疫细胞相关的基因集合,有几种方法可以使用:从相关数据库下载,也可以通过单细胞数据分析获得,还可以通过免疫浸润+WGCNA的方法得到。

今天小云

再告诉你一个方法,就是利用GEO数据库中现成的免疫细胞相关数据进行分析获得。

比如这篇文章,就是通过分析M-MDSCs相关数据得到的M-MDSCs相关基因,进行后续分析的,一起来看看吧。

题目:筛选和鉴定一个新的M-MDSCs相关基因标记,用于预测肺腺癌患者的预后风险和免疫治疗反应

杂志:Frontiers in genetics

影响因子:4.772

发表时间:2023年1月

研究思路

分析TCGA中肺腺癌(LUAD)相关差异表达基因,从GEO数据库中提取单核细胞髓源性抑制细胞(M-MDSCs)相关基因。利用单变量生存分析和随机森林算法筛选候选基因。采用最小绝对收缩和选择算子(LASSO) Cox回归分析建立风险模型。根据中位风险评分将患者分为高风险组和低风险组。进行GO和KEGG富集分析,以及ESTIMATE和ssGSEA。预后生物标志物和肿瘤突变负荷(TMB)联合预测预后。采用Nomogram方法预测患者1、3、5年的生存概率。

主要研究结果

1. LUAD患者中M-MDSCs相关预后特征基因的筛选

分析正常对照组和TCGA-LUAD患者之间的差异表达基因DEGs(图1D)。分析GEO数据集中单核细胞和M-MDSCs之间的M-MDSCs相关的差异表达基因(M-DEGs)(图1B,C)。采用两种不同的算法(包括单变量Cox回归和随机森林)选择最显著的预后相关基因,(图1A、E)。

图1.LUAD患者M-MDSCs相关特征基因的鉴定

2. LUAD患者M-MDSCs相关预后模型的构建与验证

单变量Cox回归和随机森林分析结果取交集获得9个基因(图2A),LASSO分析筛选出8个基因构建预后模型 (图2B,C)。

图2. 基于M-MDSCs相关特征基因的LUAD患者风险模型

计算每个LUAD患者的风险评分,根据风险评分的中位数分别将TCGA和GEO数据集分为两个风险组(图3A、B)。蓝点为存活患者,红点为死亡患者,随着风险评分的增加,生存时间明显缩短(图3C、D)。t-SNE图显示各组间有良好的分组效果(图3E、F)。

图3. 训练(TCGA)和验证集(GSE68465)风险评分的分布

K-M曲线分析显示生存期差异显著,低风险组预后较好(图4A、B)。1年、3年和5年的时间相关ROC曲线下面积显示较好的预测能力(图4C、D)。

图4. 预后模型的预测能力评估

3. 功能和通路富集分析和两个风险组之间的免疫状态分析

对两组之间的DEGs进行了GO注释、KEGG富集分析,主要富集于代谢和多细胞生物过程。KEGG结果显示,高危组细胞周期过程显著富集(图5A、B),而低危组IFN-γ和炎症相关通路显著富集(图5C)。

图5.LUAD患者高风险组和低风险组功能及通路富集分析

采用ESTIMATE算法比较两个风险组的免疫状态(图6A-D),低风险组的免疫评分和ESTIMATE评分显著高于高风险组,而低风险组的肿瘤纯度显著低于高风险组。然后进行ssGSEA比较免疫细胞的分布(图6E)。低风险组“活化B细胞”、“活化CD8+T细胞”、“活化树突状细胞”、“自然杀伤细胞”明显富集。

图6. 通过ESTIMATE和ssGSEA算法分析LUAD患者高、低风险组的免疫状态差异

4. 两风险组TMB情况分析

对高、低风险组的TMB进行分析,图7A、B显示了两个风险组间突变的差异,高风险组(90.64%)的突变频率高于低风险组(79.48%)。箱线图显示低风险组相对于高风险组的TMB值更低(图7C)。总生存分析显示,低TMB和高风险组的患者预后最差,而高TMB和低风险组的患者预后最好(图7D)。

图7.LUAD患者高、低风险组TMB及不同组合预测预后分析

5. LUAD患者列线图的构建及校准

列线图将风险评分与其他临床特征相结合,包括年龄、阶段和性别,用于预测 1 年、3 年和 5 年的总体生存概率(图8A),在实际结果和预测结果之间观察到良好的一致性(图8B-D)。

图8. 预测LUAD患者总生存期的nomogram

 

总结

这篇文章的创新点就在于基于M-MDSCs相关基因进行分析,后续的预后模型、风险评分等内容都是常规分析。 

而且使得基于免疫细胞的分析又添了新的思路-- M-MDSCs细胞。不仅肿瘤、非肿瘤疾病也可以分析包括M-MDSCs细胞在内的免疫细胞,非肿瘤疾病分析空间更加广泛哦!

如果您想设计免疫细胞或者其他方向的生信分析思路,但是时间和精力有限,来找番茄君帮忙吧~超多个性化、创新性高的分析思路供你选择!

 


最新纯生信思路教你如何基于单核细胞髓源性抑制细胞(M-MDSCs)相关基因进行分析!基于的评论 (共 条)

分享到微博请遵守国家法律