欢迎光临散文网 会员登陆 & 注册

中国医科大学最新Q1区文章!4种机器学习算法助力生信新方向发文!

2023-11-29 16:19 作者:尔云间  | 我要投稿

小云之前直播的时候给大家推荐过 “分子机制”方向的生信思路,分子机制方向做生信可是大有可为的,因为这个大方向下面有很多小分支方向可选,比如乙酰化、RNA甲基化、糖基化、泛素化、乳酸化修饰···再把这么多方向跟不同疾病排列组合一下,发文空间非常大! 因为分子机制方向做生信不限制疾病,肿瘤和非肿瘤都能做,双/多疾病分析也能做哦,如此万能快拿去做生信吧!

(ps:如果不知道如何选择或没有创新的分析方向,可以找小云帮忙设计!)

小云这回介绍一个分子机制的衍生思路——基于糖基转移酶相关基因进行分析。文章的选题方向创新性比较高,并且思路又易复现,是个不可多得的生信发文好思路,目前这个方向发文量比较少,创新性比较高,对分子机制方向感兴趣的小伙伴可以冲!

题目:糖基转移酶与子宫内膜癌预后及诊断生物标志物的关系

杂志:Computers in biology and medicine

影响因子:7.7

发表时间:2023年6月

 数据信息

研究思路

子宫体子宫内膜癌(UCEC)侵袭转移能力强,复发率高,生存率差。糖基转移酶是协调糖基化过程的重要酶之一,糖基转移酶对蛋白质的异常修饰与癌症的发生发展密切相关。本文基于TCGA上公布的UCEC转录组数据,运用生物信息学方法预测糖基转移酶相关基因(GTs)表达与UCEC诊断和预后的关系。并通过临床样本验证模型基因。采用广义线性模型(GLM)、随机森林(RF)、支持向量机(SVM)和极端梯度增强(XGB) 4种方法筛选具有诊断意义的生物标志物,并采用二元logistic回归建立2-GT的诊断模型。采用GEO外部数据库对诊断模型进行验证。此外,使用单变量、Lasso和多变量Cox回归分析建立了6-GT的预后模型,并通过使用bootstrap进行内部验证使模型更加稳定。此外,风险评分与免疫微环境(TME)、免疫浸润、突变、免疫治疗和化疗密切相关。  

主要研究结果

1. 差异表达糖基转移酶相关基因(DE-GTs)诊断模型的建立

在TCGA-UCEC数据集中对GTs进行差异分析,有31个DE-GTs。作者使用四种机器学习方法来筛选生物标志物,包括GLM、SVM、XGB和RF,筛选最具诊断意义的基因,4种方法相交的基因分别为GLT8D2和POMGNT2(图1B)。 采用二元logistic回归分析建立GLT8D2和POMGNT2的诊断模型。绘制单基因诊断和联合诊断的ROC曲线(图1C)。并使用GEO数据库中的GSE17025来验证模型的诊断效果。ROC曲线显示,该模型具有良好的诊断效果(图1D)。临床样本验证两者基因的表达 (图1E和F)。

图1 DE-GTs诊断模型和验证

2. DE-GTs预后风险模型的建立和内部验证

通过单因素Cox回归分析获得7个DE-GTs(图2A)。Lasso Cox回归分析得到6个基因(图2C和D)。6个GTs用于多变量Cox回归分析以建立预后模型,并使用bootstrap进行内部验证(图2E)。基于这6个GTs计算风险评分,根据中位风险评分将TCGA-UCEC数据集分为高危组和低危组。两危险组的K-M生存、风险评分分布、生存状态图均显示,低危组预后明显好于高危组(图2F、G)。

图2 DE-GTs预后风险模型的建立和内部验证

3. 肿瘤微环境、免疫细胞与免疫通路的相关性分析

ESTIMATE算法计算出高危组和低危组中每个样本的ESTIMATE得分。结果显示,低危组的ImmuneScore和ESTIMATEScore较高,而StromalScore无统计学意义(图3A)。使用ssGSEA量化各种免疫细胞的浸润评分和免疫活性,并描述UCEC不同风险组间免疫评分的差异。这些免疫细胞的浸润程度主要表现为低危组CD8+T细胞、DC、TIL细胞、T辅助细胞等的丰度较高(图3B)。 低危组免疫活性较高,包括检查点、T细胞共刺激、HLA和II型IFN应答等。然而,I型IFN反应在高危组更为丰富(图3D)。使用各种算法来评估免疫细胞与风险评分之间的相关性(图3C)。然后分析免疫检查点在高危组和低危组的表达情况。结果显示CTLA4、CD200、CD276等在低危组表达较多。低危组TNFRSF8、IDO1、CD40等表达较低(图3E)。

图3 风险评分与肿瘤微环境及免疫的相关性研究

4. 免疫治疗分析

分析两个危险组间微卫星不稳定性(MSI)和肿瘤免疫功能障碍和排斥反应(TIDE)的差异。结果显示,低危组的TIDE较低,低危组的MSI较高(图4D和E),说明低危组对免疫检查点抑制剂治疗的反应性较好。此外,作者分析了高危组和低危组对免疫检查点抑制剂(ICI)治疗的反应性。结果显示,低风险组使用CTLA4和PD-1具有更高的IPS(图4F-H)。说明预后模型所定义的低危组在免疫治疗上具有良好的效果。

图4 风险评分与免疫治疗和体细胞突变的相关性

5. 化疗分析

以上研究表明,与高危组相比,低危组更适合免疫治疗。因此,作者在高危人群的治疗中辅以化疗药物。结果显示高危组紫杉醇、索拉非尼、顺铂的IC50明显较低,通过DrugMAP数据库检索了药物的化学结构(图5A-C)。(ps:DrugMAP数据库是一个综合性的药物数据库,可以查询药物的靶点、转运体、药物代谢酶,以及药物的结构信息、药物相互作用信息、药物相容性信息。)

图5 高危人群的化疗药物及其药物结构

 总结

这篇文章的亮点是基于糖基转移酶相关基因进行分析,选题方向创新性比较高,数据量很充实,诊断和预后模型都有,再加上简单的临床样本验证,发到7+还是比较轻松的!目前糖基转移酶方向的生信文章并不多,发文空间还是相当大的,用上这个思路,换个疾病或肿瘤快去复现吧!  如果你还苦恼于生信分析没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对糖基转移酶等方向感兴趣的小伙伴快来联系小云吧!

中国医科大学最新Q1区文章!4种机器学习算法助力生信新方向发文!的评论 (共 条)

分享到微博请遵守国家法律