欢迎光临散文网 会员登陆 & 注册

近千例患者的肠道菌群测序样本收集不到?莫慌,生信挖掘可以实现!8+的纯生信分析等您

2023-01-12 13:56 作者:尔云间  | 我要投稿

   

近几年,单纯的测序和数据分析发表高分文章的难度越来越高了。

    肠道菌群绝对是少有的几个重要方向之一。

    我们在pubmed检索发现,近3个月中,涉及菌群16s测序的文章已经达到了近700篇,相当于每天6-7篇的频率,这个数量是很惊人的。

    其中,要想达到高分数,增加样本数量是一种途径。

    比如,下面这篇33分的文章,就检测了共计3127例患者(测试集2472例和验证集655例)。

    对我们多数研究者来说,收集到几十例患者已经花费九牛二虎之力,且不说还有后面巨量的测序费用支撑。所以,有时候却只能望洋兴叹,败兴而归。

    该如何解决了?其实粉丝们可能已经知道思路了--数据挖掘。对的,小云之前未分享这类思路,因为在过去的想法里,影响菌群的因素较多,所以不同项目的患者放到一起分析,是否会引入更多误差,分析结果是否有保证等考虑,都是影响这一思路的重要因素。

    今天,这个顾忌可以打消了。我给大家分享一篇8+的文章,作者集合6个不同研究项目,汇总了825例胃活检样本,来进行整合分析,证明了这个思路的可行性。(如果没有分析思路或者文献复现有困难,可以找小云,超多创新性高的分析思路和分析服务供你选择!)

    而且,我已经替大家打探好了,虽然近3个月中的菌群16s测序的文章已经达到了近700篇,但是尚未有任何菌群16s挖掘的文章发表,这个方向仍是一片蓝海,大家可以迅速来复现(搜索显示出的5篇,经确认均不是数据挖掘文章)。

l 题目:粘膜微生物群的分析揭示了胃癌发生过程中的微生物特征

l 杂志:Oncogene

l 影响因子:IF=8.756

l 发表时间:2022年7月

数据信息

数据集/队列               数据库                数据类型                    样本信息 

Sung_2019         作者赠送              测序数据              311例胃粘膜样本

Coker_2018     作者赠送           测序数据                   404例胃粘膜样本

PRJNA413125            GEO                测序数据               135例胃粘膜样本

PRJNA310127        GEO               测序数据                  134例胃粘膜样本

PRJNA239281              GEO                   测序数据                31例胃粘膜样本

PRJEB21497             GEO              测序数据                     12例胃粘膜样本

研究思路


    基于GEO公共数据集和作者赠送,共获取了6个数据集825例胃活检样本的16s测序数据。作者对患者进行了分组,分为SG浅表性胃炎组、AG萎缩性胃炎组、IM肠化生组和GC胃癌组,共计4个组。比较了4组患者之间的菌群变化,筛选出多种菌群在各组间存在显著差异,并构建了诊断模型。特别是浅表性胃炎组和胃癌组之间,幽门螺杆菌存在显著变化。

分析结果

1. 胃癌不同阶段的患者,其肠道菌群组成存在显著差异

作者将825例患者进行了分组,分为SG浅表性胃炎组、AG萎缩性胃炎组、IM肠化生组和GC胃癌组4个组。16s分析发现,肠道菌群在以上四组中存在差异,门水平展示(图1A)以及属水平展示(图1B)。α多样性比较发现,以上4组患者的菌群香农指数依次降低,且均存在显著差异(图1C)。β多样性分析发现,胃癌组的菌群与其他3组存在显著差异(图1D)。

图1胃癌不同阶段的患者肠道菌群的组成差异

2. GC(胃癌)组和SG(浅表性胃炎)组之间的菌群差异分析和诊断模型构建

作者重点比较了GC(胃癌)组和SG(浅表性胃炎)组的菌群,共发现52个门的菌存在变化。其中,35个门菌在GC组升高,而17个门菌在SG组更多(图2A)。进一步从52个门菌中筛选出来8个门菌进行诊断模型构建。在训练集和验证集中的AUC面积分别达到了0.9109(图2B)和0.8533(图2C),表明模型的质量较高。

2胃癌诊断模型的构建

3. 参与胃癌调节菌群的相互作用关系分析

为探讨疾病相关细菌在胃癌进展过程中的相互作用,作者使用SparCC算法估计了它们的相关性。与胃癌正相关细菌随着疾病进展而逐渐增强,特别是梭杆菌与Prevotella、链球菌和链球菌(图3)。随着胃癌的发展,抑制胃癌的细菌逐渐减少,包括双歧杆菌、芽孢杆菌和瘤胃球菌(图3)。

3胃癌发展过程中菌群相关性分析

4. 幽门螺杆菌对肠道菌群的影响

比较幽门螺杆菌阳性患者和阴性患者的胃黏膜菌群,作者发现幽门螺杆菌阴性患者的菌群α多样性明显升高(图4A);β多样性分析也发现,幽门螺杆菌阳性患者和阴性患者的胃黏膜菌群存在显著的差异性(图4B);与幽门螺杆菌阳性组相比,幽门螺杆菌阴性组中观察到更多的细菌之间的强排斥和共发生等相互作用(|r|>0.5,调整后的p值<0.05)(图4D)。

文章小结

作者利用公共数据,当然也可能动用了些资源,最终获得了近千例患者的测序数据,这样就具有了根据临床表型分类的前提,否则,如果一共也只有几十例患者,再细分表型,那么数据可行度就显著降低了。

通过这篇文章,我们可以看到肠道菌群在进行数据挖掘方面也是可行的,包括疾病不同分型之间的菌群比较、肿瘤疾病的预后模型构建,以及疾病的诊断模型等均可以实现。

小云悄悄话

因为肠道菌群的变化敏感性和特殊性,所以将不同研究项目里的多个数据集进行整合,会有一些顾忌。

那么如何提高整合分析的成功率了?计划合并的各个研究项目,采取了较为一致的纳入排除标准,并且有完整的患者临床信息,这样为分析和后面的患者分型提供了可能性。

综合来讲,肠道菌群数据挖掘是个好思路,并且随着肠道菌群测序数据越来越多,测序类型越来越丰富,数据挖掘自然限制越来越少,这是个良性循环,所以肠道菌群数据挖掘是一片蓝海,广阔天地大有作为啊!有想法的朋友尽快上车,一个方向一旦火爆起来,发文竞争力可就大多了,时不我待呀!

如果你还苦恼于生信没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对新的热点方向感兴趣的小伙伴快来联系小云吧。

小云可以提供如下服务:免费评估服务、付费设计服务、定制化生信分析等。超多个性化、创新性高的分析思路供你选择!



近千例患者的肠道菌群测序样本收集不到?莫慌,生信挖掘可以实现!8+的纯生信分析等您的评论 (共 条)

分享到微博请遵守国家法律