3张图达到6+?CNS宝藏级热点“肠道菌群”的纯生信分析,让您不再受困于样本和经费

不止一位小云朵和我反馈,在肿瘤的各种模型构建中,是否有一种方向上的大创新,而不只是在基因集上做小调整。那么,今天小云推荐给大家的就是一位重量级选手“肠道菌群”。

“免疫治疗”和“肠道菌群”的关系,那可是大有渊源的。近几年来,《Science》杂志发表近10篇论述肠道微生物影响肿瘤免疫治疗研究的文章。比如下面这篇封面文章就基于38名接受抗PD-1检查点抑制剂和4名接受抗CTLA4治疗的黑色素瘤患者证明了肠道菌群是预测患者免疫反应的重要指标。

然而,过去的基于 “免疫治疗”和“肠道菌群”研究课题,需要研究者能招募到经过免疫治疗的临床肿瘤患者,收集患者治疗前后的粪便/血清等样本,再基于测序才能进行这项研究。这一定程度上限制了部分研究者。因此,利用公共数据进行肠道菌群挖掘,就是我们今天给大家分享的重点。
肠道菌群的公共数据怎么找了?可用数据多吗?那我们可以解答下这些问题。我们以相对最全的数据库NCBI的GEO为例,检索宏基因组测序发现,目前已有961套宏基因组测序数据,可用的疾病方向还是很广的(下图)。

除了GEO这个整合平台之外,近年来还涌现出一些肠道菌群专门的数据库,比如gutMGene、CRAMdb、GMrepo和gutMEGA等,也可以供肠道微生物的挖掘和分析,我们会在后续内容中逐步给大家展示,欢迎大家持续关注。
那么今天给大家分享的这篇文献和思路,是基于网络公开数据的生信分析,性价比极高,希望能帮助到大家。(如果没有分析思路或者文献复现有困难,可以找小云,超多创新性高的分析思路和分析服务供你选择!)

l 题目:探讨肠道微生物预测非小细胞肺癌免疫治疗的效果
l 杂志:Cancers(Basel)
l 影响因子:IF=6.575
l 发表时间:2022年11月
数据信息
数据集/队列 数据库 数据类型 样本信息
PRJNA866654 GEO 测序数据 6例长生存期和3例短生存期
PMID: 29097494 GEO 测序数据 7例长生存期和34例短生存期
研究思路
基于GEO公共数据集,共获取了2个数据集。数据集为非小细胞肺癌(NSCLC)患者在进行PD-1免疫抑制剂治疗后,根据患者无进展生存期(PFS)长短,分为短生存期(小于3个月)和长生存期(大于6个月);使用MetaPhlAn对这些患者肠道微生物组的宏基因组测序数据进行分类;使用UproC和KEGG Orthology构建微生物组功能注释谱。将差异菌群进行分类并构建疾病预后模型。
分析思路

分析结果
1. 长生存期和短生存期患者肠道微生物组的分类差异
免疫治疗后的长生存期(>6个月)和短生存期(<3个月)患者肠道微生物组的α多样性β多样性表现出一些区别,但是差异并不显著。利用菌群组成差异来进行样本分类,效果并不明显。

2. 长生存期和短生存期患者肠道微生物组的功能差异分析
基于Pfam和KEGG对两组患者肠道微生物组的功能分析发现DS1组(作者前期自测数据)中有 171 和 163 蛋白家族表现出显著性差异(p-value ≤ 0.05);而DS1组(公共数据中的测序数据)中给出213和239 差异基因。

3. 基于菌群物种和功能基因的随机森林预测分值分布

4. 随机森林预测模型及MLP预测模型的表现验证
基于随机森林模式构建的预测模型,其Pfam曲线获得最佳F1分数(85.2%)和最佳准确度(92.8%)。MLP预测模型中,Pfam、KEGG、Orthology以及联合预测的AUC分数达到97%-100%,F1分数达到98.4%- 99.9%。

文章小结
通过这篇文章,我们可以看到肠道菌群在进行数据挖掘方面也是可行的,包括肿瘤疾病的预后模型构建,诊断模型等均可以实现,且这篇文章是基于宏基因组数据来进行,那么基于16s或者基于代谢组的菌群测序数据,也可以作为公共数据进行挖掘,后续我们给大家一一进行分享。
小云悄悄话
综合来讲,通过这篇文章,我们可以看到肠道菌群在进行数据挖掘方面也是可行的,包括肿瘤疾病的预后模型构建,诊断模型等均可以实现,且这篇文章是基于宏基因组数据来进行,那么基于16s或者基于代谢组的菌群测序数据,也可以作为公共数据进行挖掘,后续我们给大家一一进行分享。
如果你还苦恼于生信没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对新的热点方向感兴趣的小伙伴快来联系小云吧。
小云可以提供如下服务:免费评估服务、付费设计服务、定制化生信分析等。超多个性化、创新性高的分析思路供你选择!
