最新Nature热点“m7G”修饰,发文基数小涨幅快,纯生信分析挖掘时机刚刚好,8+纯生信

RNA修饰近些年风头正盛,不过大家当前重点关注的是m6A修饰,其次像m1A和m6A等,这些内容前期已经和大家分享,感兴趣的粉丝可以看看前文。今天给大家主要介绍m7G,也是RNA修饰里的后起之秀。
N7-甲基鸟苷(N7-methylguanosine, m7G)是tRNA的完整性和稳定性所必需的。tRNA m7G甲基化复合物主要由甲基化酶METTL1和辅助蛋白WDR4组成,但是其具体过程尚不清楚。2023年1月4号的Nature文章“Structural basis of regulated m7G tRNA modification by METTL1-WDR4”发现WDR4可作为METTL1和tRNA T臂的支架,并解释了这个过程。

并不算是大的研究热点,其Pubmed发文数表现出明显的基数小,但
涨幅快的特征,2022年发文数近似翻倍,刚好处于增长但尚未泛滥的阶段,非常适合入手(图1)。

图1 “m7G”的pubmed发文数量
当然,熟悉小云的粉丝都知道,小云并不是主推实验思路的,那么我们给出“m7G”的方向,也是为了推荐大家进行生信数据分析的。
下面,我们就具体分享一篇8+的纯生信分析的m7G相关文章,进行示例展示,方便大家复现。(如果没有分析思路或者文献复现有困难,可以找小云,超多创新性高的分析思路和分析服务供你选择!)

题目:肺动脉高压患者m7G甲基化修饰模式与肺血管免疫微环境的数据分析
杂志:Front Immunol
影响因子:IF=8.8
发表时间:2022年12月

研究思路
对GSE15197和GSE113439数据集中的m7G调节基因进行了差异分析。基于LASSO回归和随机森林筛选疾病特征基因。然后,构建了一个基于差异m7G调节基因的预后模型,并在GSE113439数据集上进行验证。随后,使用ssGSEA算法对PAH患者的免疫细胞丰度进行分析。最后,我们根据PAH的基因集筛选可能的上市药物。有关详细信息,请参见图形摘要。

分析结果
1. PAH患者的差异m7G调节基因鉴定
使用limma包筛选GSE15197数据集中差异表达的m7G调节基因。筛选出15个差异表达的m7G 调节基因(NSUN2, DCP2, DCPS, NUDT11, NUDT16, NUDT3, CYFIP1,EIF4E, EIF4E2, NCBP1, EIF3D, EIF4A1, EIF4G3, IFIT5和SNUPN)。表明m7G调节器在PAH发病过程中发挥了关键作用。


图2 PAH患者的差异m7G调节基因鉴定
2. 筛选出与疾病特征相关的m7G调节基因
为了筛选出与PAH相关的m7G调节基因,使用了3种机器学习方法。LASSO回归分析筛选出NSUN2, CYFIP1, EIF4E, NCBP1和IFIT5基因为PAH相关的m7G调节基因(图3A);随机森林法筛选出了8个PAH相关的m7G调节基因(图3B);EIF4E, CYFIP1,IFIT5和 NUDT3基因则是SVM-RFE分析获得的差异TOP基因(图3D);将上述3种分析方法获得的基因取交集,则最终获得了如下3个基因CYFIP1, EIF4E和 IFIT5为PAH相关的m7G调节基因(图3E)。


图3与疾病特征相关的m7G调节基因的筛选
3. PAH诊断模型的构建和验证
为了预测疾病的发病,我们构建了一个基于上步获得3个PAH相关的m7G调节基因(CYFIP1、EIF4E和IFIT5)构建模型(图4A)。列线图模型在预测PAH方面具有较高的准确性(图4B)。同时,DCA显示“诺模图”曲线在灰色线以上,表明患者在高风险阈值为0到1区间时,可以适用于此列线图模型(图4C、D)。。这些结果还表明,CYFIP1、EIF4E和IFIT5三个基因在PAH发病过程中可能具有关键作用。


图4 PAH诊断模型的构建和验证
4. 基于m7G调节基因表达对PAH患者进行分型
基于15个差异表达m7G调节基因,利用R进行“Consensus Cluster Plus”分析,将PAH患者分为cluster A和cluster B(图5 A);Cumulative Distribution
Function也证实将患者分为2组时有最佳值(图5 B);对PAH患者进行PCA分析,发现cluster A和cluster B可以显著区分开(图5 C);cluster A和cluster B存在显著差异,其中DCPS, NUDT16, NUDT3, EIF4E2和SNUPN基因在 type A中降低,而NSUN2, DCP2, EIF4E和 IFIT5在type B中被调节(图5 D)。


图5 基于m7G调节基因表达对PAH患者进行分型
5. PAH中生物标志物与免疫细胞的相关性分析
为了进一步阐明PAH患者和对照组之间的免疫差异,作者使用ssGSEA分析评价GSE15197数据集中患者的28种免疫细胞,结果表明m7G cluster A和m7G cluster B患者群体之间的免疫细胞差异显著(图6A);MDSC、单核细胞、活化CD4 T cell、调节性T下表和Th2细胞在两组间存在差异(图6B);进一步对免疫细胞和m7G调节基因做了相关性分析(图6C);CYFIP1基因和记忆CD4 T细胞、调节性T细胞、活化性T细胞成正相关;与Th17细胞呈负相关(图6D)。


图6 高风险组和低风险组患者的差异基因分析
6. 对PAH疾病的靶向药物评价
针对PAH的治疗价值,对已上市的药品进行评价。表1对DSigDB数据库中,具有靶向m7G调节基因的有效药物进行了评分。基于P值的大小,列出了前10名潜在药物。此10种药物可能对PAH的临床治疗具有研究意义。

表1 对PAH疾病的靶向药物评价
文章小结
这篇文章是以Nature热点“m7G”的调节基因为研究对象,在对PAH的临床数据进行分析,以构建特征基因、建立疾病预测模型、对患者进行分型和不同分型患者的表型比较等思路。其主要创新点为“m7G”研究对象,后续分析方法和思路相对成熟。
因此,如果对表观遗传感兴趣,且想突破m6A等方向,那么m7G方向,换个疾病就可以复现一篇文章,暂时还未做这方面分析的,那么赶紧动手吧,抓紧复现。
小云悄悄话
如果你还苦恼于生信没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对新的热点方向感兴趣的小伙伴快来联系小云吧。
小云可以提供如下服务:免费评估服务、付费设计服务、定制化生信分析等。超多个性化、创新性高的分析思路供你选择!
