欢迎光临散文网 会员登陆 & 注册

孟德尔随机化如何转型升级?MR整活各种“生信分析”

2023-10-09 17:20 作者:尔云间  | 我要投稿

又是一篇孟德尔随机化研究!小云毫不犹豫的说,现在见刊出版的每一篇孟德尔随机化文章,都是值得学习的!因为前期卷的太疯狂,套路过于成熟,而现在还能搞出高分文章出来,作者都是做了很多的创新的,这些创新思路和研究方法太值得学习了,因为哪怕不是做MR研究,这些创新思路和研究手段在其他生信研究中同样可以应用!所以可千万不能错过哟! 话不多说,直接上文!今天小云带来的这项MR研究,选题上针对的是类风湿性关节炎(RA),关注的是药物治疗方面的研究。这项研究的优点一是第一次使用MR来识别RA药物靶点的研究,利用了迄今为止最大的公开可访问的RA风险GWAS的数据,并使用了MR复制研究,大大减少了假阳性的可能性;二是富集分析阐明了这项基因的功能特性以及这项药物靶基因通过PPI的调控关系,为旁路开发RA药物提供了潜在的可能性;药物预测说明了这些基因的药用潜力,分子对接的高结合活性表明这些基因作为药物靶点的强大潜力。 总之,在这项大规模药物靶标探索中,作者整合了MR研究、药物预测、基因共定位分析、PheWAS分析、基因富集分析和蛋白质-蛋白质相互作用网络构建等一系列分析手段。生信手段齐出马,简直是生信研究人的福音啊,这样的学习机会可不能白白错过,小伙伴们快和小云一起来学习吧!

(ps:不知道怎么创新的小伙伴可以来找小云!这里有新鲜出炉的生信热点方向,还有一大波的可复现的创新思路,感兴趣的直接后台找我噢!)。

题目:从遗传学角度确定治疗类风湿性关节炎的潜在药物靶点:孟德尔随机研究

杂志:

Journal of Translational Medicine

影响因子:IF= 7.4001

发表时间:2023年9月11日

研究背景

类风湿性关节炎(RA)是一种以滑膜炎和软骨破坏为特征的慢性炎症性免疫介导疾病,主要影响关节的滑膜、腱鞘和滑囊等,表现为关节疼痛、僵硬、肿胀、畸形等和功能障碍。RA无法治愈,患者需长期服用药物以减轻症状,这些药物通常被归类为缓解疾病的抗风湿药物、糖皮质激素、非甾体类抗炎药物和生物药物。但仍然有很大一部分患者被视为“难治”类风湿性关节炎患者。将遗传学纳入药物开发可能是增强这一过程的最有效策略之一,因为遗传支持的疗法更有可能在临床试验中取得成功。因此,这项研究利用MR模仿随机对照试验来预测药物疗效,与基因表达变化相关的SNP(表达定量性状位点,eQTL)可能与长期暴露于针对编码蛋白的药物相当,利用RA的GWAS与遗传变异(SNP)之间的关联数据,探讨治疗类风湿性关节炎的潜在药物靶点。

数据来源

MR分析的暴露(Exposure)数据:eQTL数据从eQTLGen Consortium (https://eqtlg en.org/) 获得。这项研究考虑到eQTL更接近药物开发研究中感兴趣的基因,故使用的eQTL仅限于起点上游5kb或终点下游5kb的SNP,最终获得了2554个可成药基因的eQTL。 MR分析的结局(Outcome)数据:RA发现队列的GWAS数据是从之前的一项大型多种族研究中获得(包括37个队列的35871例RA病例和240149例对照)。为与暴露数据保持一致,选择了来自欧洲家系样本(22350例病例和74823例对照)的GWAS数据作为结局数据。复制研究中8279例病例和261098例对照的复制队列的GWAS数据来自FinnGen Release 8 (https://www.finng en.fi/en)。

研究思路

作者首先利用MR方法和GWAS研究数据确定RA的新治疗靶点,结合cis-eQTL和RA风险关联数据建立暴露和结果之间的因果关系;然后通过药物预测和分子对接研究验证了七个潜在RA药物靶点的药理活性;再进行基因共定位分析确认潜在治疗靶点和RA风险之间的共同驱动因素;再利用PheWAS分析探讨潜在治疗靶点与其他特征之间的关联;最后,基因富集分析和蛋白质-蛋白质相互作用网络构建揭示潜在治疗靶点的功能特征和生物学相关性。

图1 研究设计及流程

主要结果

1. 发现阶段中32个基因与RA风险显著相关

目前针对RA性状最大规模的GWAS是2022年的一项大型多种族研究,包含22350例欧洲血统病例和74823例对照。如图所示。如图2、3所示,在发现队列中,32个基因的表达与RA风险存在因果关系(p<1.96E−5=0.05/2554,对2554个药物靶标进行Bonferroni校正)。然而,进行敏感性分析时,BRSK1基因在三种方法中的效应值方向不一致,CD226和MMEL1基因未通过水平多效性检验(P<0.05),因此这三个基因被排除在后续分析之外。异质性测试的结果表明ITPR3、HLA-DPA1、C5、MMEL1和CTLA4的SNP之间存在异质性。

图3 森林图显示32个重要基因在发现阶段的发现

2. 复制期12个基因在独立的RA队列中仍然很重要

在复制阶段,使用了芬兰FinnGen数据库中的GWAS数据,包含8279例欧洲血统病例和261098例对照。MR分析的执行方式与发现队列中的相同。使用Wald比率或IVW方法,12个基因的遗传预测表达被复制为与RA风险存在因果关系,如图4所示(Bonferroni校正后显着,P<0.0017=0.05/29)。由于三种方法的效应值方向不一致,CTLA4基因被排除在后续分析之外。水平多效性测试显示任何基因都没有显着的多效性。在异质性测试中,HLA-DRB1、ITPR3、CTLA4、FCGR2B、CCR6和HLA-DPA1基因显示出SNP间异质性。此外,由于发现阶段和复制阶段之间的效果估计方向不一致,HLCS基因被排除在后续分析之外。

图4 森林图显示12个重要基因复制阶段的发现

3. 共定位分析

先前的研究表明,显著的MR结果可能来自SNP处于紧密连锁不平衡状态的位点,并且其中SNP暴露和SNP结果关联来自两个不同的因果SNP,因此可能导致推断的假阳性结果。当SNP与暴露和结果明显相关时,共定位分析可用于探索暴露和结果是否具有相同的因果SNP。有证据表明,经过MR和共定位测试的蛋白质更有可能成为药物靶点,并且更有可能获得批准。因此,作者决定使用发现阶段数据对之前分析中提出的11个基因进行共定位。如表1所示,11种蛋白中的7种(CCR6、HLA-DPA1、HLA-DRB1、IFNGR2、C5、ATP2A1和FEN1)显示出与RA共定位的有力证据(PP.H4>0.8),并且可以作为候选药物靶点基因。

表1 11个基因的eQTL与RA相关SNP的共定位结果

4. PheWAS

为了进一步评估所确定的7个潜在药物靶基因是否会对其他性状产生有益或有害的影响,以及是否存在MR-Egger拦截测试未捕获的潜在多效性,作者使用了17361个二分表型和1419个定量表型。阿斯利康PheWAS门户数据库在基因水平上执行PheWAS。PheWAS结果可以解释为基因决定的蛋白质表达与特定疾病或性状的关联。如表2所示,除ATP2A1外,六个药物靶标均未与基因水平的其他性状显着相关(基因组关联P<5E−8),这表明作用于这些靶标的药物的潜在副作用和这些基因中水平多效性的存在可能很小,进一步表明本研究结果的可靠性。相反,ATP2A1与握力呈正相关,与手臂阻抗呈负相关,表明作用于ATP2A1基因的RA药物可能会影响这两个性状,并且ATP2A1基因的MR分析可能会对结果产生多效性影响。

表2 使用阿斯利康PheWAS门户发现与APT2A1显著相关的特征

5. 富集分析

GO富集分析通常用于显示基因和术语之间的相互作用,而KEGG富集分析可以说明基因和功能通路之间的关系。如图5所示,BP类别中最重要的通路均与干扰素-γ相关(干扰素-γ介导的信号通路、对干扰素-γ的细胞反应、对干扰素-γ的反应)。在CC类中,药物靶基因同样富集免疫和内质网相关成分(MHC II类蛋白复合物、MHC蛋白复合物、内质网腔侧的整合成分、内质网膜的腔侧和内质网膜的腔侧)。此外,就MF而言,这些基因还涉及与免疫密切相关的功能(免疫受体活性、MHCII类受体活性、肽抗原结合、细胞因子受体活性和抗原结合)。如图6所示,KEGG富集分析的前3条通路分别是炎症性肠病(IBD)、利什曼病、Th1和Th2细胞分化,其中IBD是一种自身免疫性疾病。IBD是一种自身免疫性疾病,利什曼病是一种由寄生虫感染引起的疾病,这三者都与免疫反应密切相关。

6. PPI网络

将七个药物靶基因加载到STRING(https://cn.string-db.org/)数据库中进行网络创建,并将所得文件导入Cytoscape中进行可视化。图7描绘了50个节点、375个边的PPI网络中七个药物靶标与其他蛋白质的相互作用。对于使用GeneMANIA(https://genem ania.org/)构建的PPI网络,除了7个药物靶点之外,该网络还包括另外20个潜在相互作用的基因,总共490个相互作用链接(图8)。这些联系包括共表达(84.47%)、共同蛋白质结构域(9.90%)和物理相互作用(5.63%)。网络的功能分析描述了药物靶点和相关基因的作用及其功能。网络功能分析结果与之前的富集分析结果相似,均显示出较强的免疫功能相关性,与RA的自身免疫性疾病本质一致。

7. 候选药物预测

作者使用DSigDB数据库来预测潜在有效的干预药物。根据调整后的p值,显示了前10种潜在化合物(表3)。结果显示,大黄酸(Rhein TTD 00010611/CTD00001002)和酪氨酸磷酸化抑制剂(Tyrphostin AG 538 TTD 00011608)是两种最重要的药物,与FEN1和CCR6相关。相比之下,槲皮素(quercetin CTD 00006679)和砷(ARSENIC CTD 00005442)与大多数基因相互作用。

表3 使用DSigDB预测候选药物

7. 分子对接

为评估候选药物与其靶点的亲和力,并由此了解药物靶点的成药性,作者进行了分子对接。使用Autodock Vina v.1.2.2获得前五种候选药物与相应基因编码的蛋白质的结合位点和相互作用,并生成每次相互作用的结合能,总共产生七种蛋白质的有效对接结果与药物(表4和图9)。每种候选药物通过可见的氢键和强静电相互作用与其蛋白质靶标连接。此外,每个靶点的结合口袋都被四种候选药物成功占据。C5和槲皮素表现出最低的结合能(−9.364 kcal/mol),表明结合极其稳定。

图9 可用蛋白质小分子的对接结果

文章小结

这项研究有着较为明显的优点。一是第一次使用MR来识别RA药物靶点的研究,利用了迄今为止最大的公开可访问的RA风险GWAS的数据,并使用了MR复制研究,大大减少了假阳性的可能性;二是富集分析阐明了这项基因的功能特性以及这项药物靶基因通过PPI的调控关系,为旁路开发RA药物提供了潜在的可能性;最终的药物预测说明了这些基因的药用潜力,分子对接的高结合活性表明这些基因作为药物靶点的强大潜力。这项研究包含从鉴定到药物结合特性的完整评估,以强有力的证据提出了RA的七个药物靶点。所以,现在的MR研究已经不在是刚出来时候的常规MR研究的,已经完全应用于临床研究和药物治疗中了,这也是MR发文的转折点,小伙伴们在做MR研究的时候,也要开始转型了哟,必须要紧随时代升级迭代哟,小云也欢迎随时来撩!图9 可用蛋白质小分子的对接结果

文章小结

这项研究有着较为明显的优点。一是第一次使用MR来识别RA药物靶点的研究,利用了迄今为止最大的公开可访问的RA风险GWAS的数据,并使用了MR复制研究,大大减少了假阳性的可能性;二是富集分析阐明了这项基因的功能特性以及这项药物靶基因通过PPI的调控关系,为旁路开发RA药物提供了潜在的可能性;最终的药物预测说明了这些基因的药用潜力,分子对接的高结合活性表明这些基因作为药物靶点的强大潜力。这项研究包含从鉴定到药物结合特性的完整评估,以强有力的证据提出了RA的七个药物靶点。所以,现在的MR研究已经不在是刚出来时候的常规MR研究的,已经完全应用于临床研究和药物治疗中了,这也是MR发文的转折点,小伙伴们在做MR研究的时候,也要开始转型了哟,必须要紧随时代升级迭代哟,小云也欢迎随时来撩!

孟德尔随机化如何转型升级?MR整活各种“生信分析”的评论 (共 条)

分享到微博请遵守国家法律