欢迎光临散文网 会员登陆 & 注册

4张图拿下12分+纯生信?新方向“病毒感染诊断”发文就是厉害!

2023-09-19 09:11 作者:尔云间  | 我要投稿

“三阳”又来了,小伙伴们是不是又被朋友圈、小红书里的“三阳”刷屏了? 经历过一场“新冠全民战”后,关注度达到了一个新高度,这也体现在科研数量上,“新冠”成为了今年的生信科研热点。但随着新冠相关生信文章的爆发式增长,发文难度也随之变大,再想用老套路法高分可就不行了,这就提醒我们:要创新!!!

怎么创新呢?小云给你支支招:

1)选题方向定位于“新冠” ,但分析方向选择“临床数据库分析”或“孟德尔随机化”,抱上这俩大腿不愁发高分文章;2)开拓视野,从单一“新冠”扩展到“病毒类”疾病,从选题上创造优势!

今天小云就针对第2招,分享一个文章实例

(ps:想看第1招文章应用的朋友,可以关注小云,文章分享下期就来,敬请期待哦)

:文章基于10个独立队列,建立了一个由33-mRNAs构成的病毒感染诊断模型,并利用单细胞数据、机器学习算法进行进一步分析。其分析方法并不难,但依靠“病毒感染诊断”这个新方向和大队列分析,仅凭4张图就拿下了12分+的纯生信,不得不感叹性价比之高啊!下面就来具体看看~

l 题目:使用33种宿主免疫反应mRNAs的机器学习分类器准确区分鼻拭子样本中的病毒性和非病毒性急性呼吸道疾病 l 杂志:

Genome Medicine

l 影响因子:IF=12.3008 l 发表时间:2023年8月

研究背景

病毒性急性呼吸系统疾病(病毒性ARI)在世界范围内对人类发病率和死亡率有显著影响,但因其与非病毒性ARI的临床表现重叠而使得诊断变复杂,所以它们的成功治疗需要及时诊断病毒病原学。二十一世纪迄今为止的多次大流行进一步凸显了有效监测临床相关新兴病毒的需求未得到满足。最近的研究已经确定了血液和鼻腔样本中对病毒感染的保守宿主反应,因此可以基于宿主反应的基因标记,对呼吸道病毒感染进行鉴定。

数据来源

该研究纳入了10个独立队列,包括来自病毒性ARI受试者和对照受试者的鼻样本,对照样本来自健康供体或ARI康复受试者以及非病毒性呼吸道疾病受试者。前6个数据集作为发现队列,后4个队列作为验证队列。

研究流程

首先在6个发现队列中利用 Hedges'g 计算了病例(病毒性 ARI 样本)和对照中每个基因的效应大小 (ES),并根据ES阈值和FDR值筛选差异表达基因。然后使用前向搜索方法减少用于最终模型的基因数量,确定了一个33-mRNAs特征。随后,利用2个单细胞数据集分析33-mRNA标记分数的细胞分布。最后利用IML机器学习平台基于33个mRNAs开发和训练逻辑回归(LOGR)模型来提高33-mRNA标记的普适性。

1. 差异表达基因的获得

在6个发现数据集中使用MetaIntegrator进行差异基因分析,与健康对照(HC)患者相比,病毒性ARI患者的鼻拭子中有328个差异表达基因(|ES|≥ 0.6,FDR ≤ 10%)。在这328个基因中,有119个基因在发现和验证队列中以相同方向进行了差异表达(图1B, C)。在训练和验证数据集之间具有高度相关的效应大小(图1D)。针对119个基因进行GO富集分析,这些基因参与了与宿主对病毒感染的反应相关的途径(图1E)。

2. 33-mRNA宿主反应特征的建立和单细胞分析

作者利用前向搜索方法减少用于最终模型的基因数量,最终从119个基因中确定了一个33-mRNA特征(24个高表达,9个低表达),并通过使用最终基因签名中上调基因的表达减去下调基因表达的几何平均值,计算样本的33-mRNA特征评分。然后基于2个单细胞数据集(SCP1289和GSE176269)对33-mRNA特征评分的细胞分布进行了分析。将单细胞数据根据细胞类型(图5A)、感染状态(图2B)、感染严重性(图2C)和33-mRNA特征评分(图2D)的分布进行了UMAP可视化,发现巨噬细胞和中性粒细胞得分最高(图2D)。比较HC和病毒性ARI患者中的巨噬细胞和中性粒细胞比例,发现巨噬细胞的比例随着病毒性ARI的严重程度而增加(图2E),但是在单细胞水平上的33-mRNA评分和病毒性ARI的严重程度之间没有联系(图2F, G),进一步表明33-mRNA评分的增加是由于呼吸道中巨噬细胞比例的变化。

3. 33-mRNA评分的区分能力验证

在儿童和成人患者的发现和验证数据集中比较病毒性ARI患者与对照间的33-mRNA评分差异,发现病毒性ARI患者的样本水平33-mRNA评分显著高于HCs患者和非病毒性ARI患者(图3A)。接下来研究年龄、病毒类型和病毒载量是否对33-mRNA信号有影响,结果发现,儿童和成人病毒性ARI患者的33-mRNA评分没有差异(图3A),没有观察到病毒类型对33-mRNA评分的显著影响(图3B),而高病毒载量患者的33-mRNA评分明显高于低病毒载量患者(图3C, D)。这些结果表明,33-mRNA不受病毒类型的影响,并与呼吸道中的病毒载量相关。

4. 33-mRNA逻辑回归分类器的构建

为了提高33-mRNA特征的稳定性和普适性,作者利用IML机器学习平台使用发现数据集开发一个基于逻辑回归(LOGR)的分类器,该分类器可以将病毒性ARI患者从健康对照人群中区分出来。利用ROC曲线评估预测性能,显示综合AUC值为0.94,说明区分能力优异(图4)。随后又在验证队列中进行模型验证,AUC值为0.89,说明区分能力也良好(图4)。

文章小结

思路看完了,有没有感觉掌握技巧发文就是这么简单?这篇文章得益于“病毒感染诊断”的创新选题,多队列和多种数据的应用,仅凭4张图就拿下了12分+的纯生信!!目前病毒方向做这类思路的还很少,想发高分的朋友,可以出手啦! 

4张图拿下12分+纯生信?新方向“病毒感染诊断”发文就是厉害!的评论 (共 条)

分享到微博请遵守国家法律