欢迎光临散文网 会员登陆 & 注册

EQUIBIND: Geometric Deep Learning for Drug Binding Structure Pre

2023-07-05 13:36 作者:Aster的小号  | 我要投稿

在药物发现中,预测药物类似分子与特定蛋白质靶点的结合方式是一个核心问题。一种极快的计算结合方法将使快速虚拟筛选或药物工程等关键应用成为可能。现有的方法在计算上非常昂贵,因为它们依赖于重度候选采样以及评分、排序和微调步骤。我们用EQUIBIND来挑战这种范式,它是一种SE(3)-等变几何深度学习模型,可以直接预测接受体的结合位置(盲对接)和配体的结合姿势和方向。与传统和最新的基准方法相比,EquiBind实现了显著的加速和更好的质量。此外,当与现有的微调技术结合时,我们展示了额外的改进,但代价是增加了运行时间。最后,我们提出了一种新颖且快速的微调模型,该模型根据给定输入原子点云到von Mises角距离的闭合形式全局极小值,调整配体的可转动键的扭转角度,避免了先前昂贵的微分进化策略用于能量最小化。

药物发现是一个昂贵的过程,例如,一种药物的研发和测试费用约为10亿美元,需要花费10年的时间,才有可能被FDA批准。此外,这个过程可以在任何阶段失败,例如,由于意外的副作用或对所承诺的治疗效果的实验证明无效。更糟糕的是,存在着1060种可能的类似药物分子(Reymond&Awale,2012),远远超过了当前的实验能力。

准确的计算方法,例如基于深度学习(DL)的方法,可以极大地减少分子搜索空间,但需要非常快速地扫描庞大的生物和化学空间以寻找所期望的和意外的效果。例如,一种新型药物可能会失活重要的癌症蛋白质,但也可能会对人体中的其他必要蛋白质产生负面抑制作用,可能导致危及生命的副作用。考虑到人类蛋白质组含有多达10万种蛋白质类型,目前的希望是以计算方式扫描这些相互作用,然后再将一些有希望的候选物带入体外和体内测试。

药物发现的一个核心问题是理解类似药物分子(配体)与目标蛋白质(受体)之间的相互作用和形成复合物的方式,即药物结合,这是进行虚拟筛选的先决条件。这是一个复杂的问题,涉及到不同的方面和限制:结合动力学、构象变化(分子内部灵活性)以及化学和几何原子间相互作用类型是描述配体-蛋白质结合机制的领域知识的一部分(Du等,2016)。例如,分子复合物形成的经典模型有“锁-钥”、“诱导适配”和“构象选择”,而疏水、氢键和π-堆积是最常见的原子结合相互作用,但在结合过程中也经常出现其他类型的相互作用(de Freitas&Schapira,2017)。

目前,用于(3D)结构药物结合的计算方法在计算成本方面具有高质量:在我们的实验中,GNINA方法(McNutt等,2021)平均需要146秒才能处理一个配体-受体配对,而流行的商业软件Glide(Halgren等,2004)慢了多达9倍。这是由于所有先前结合方法采用的常见策略:首先通过对可能的结合位置和姿势进行彻底的采样(Hassan等,2017)生成大量候选复合物(例如数百万),然后使用评分和排序步骤检索最有希望的实例,最后,使用基于能量的微调方法来将配体最佳适合到相应的口袋位置。

在这里,我们引入了一个新的用于结构药物结合的EQUIBIND几何和图形深度学习模型-图1。受Ganea等人(2021a)的启发,我们利用图匹配网络(GMN)(Li等人,2019)和E(3)-等变图神经网络(E(3)-GNN)(Satorras等人,2021)进行直接预测配体-受体复合物的结构,而不依赖于先前工作中的大量采样,从而实现了显著的推理时间加速。此外,由于3D结构数据很少(例如,PDBbind数据库中只有约19K个实验复合物可供公开使用),将正确的物理、化学或生物归纳偏置注入DL模型中以避免从不足的数据量中学习这些先验知识并创建可靠的模型是至关重要的。为了实现这一目标,EQUIBIND具备以下特点:

  • 对两个分子的初始3D放置和方向的独立性进行保证,即对于相同的输入未结合结构,始终预测出完全相同的复合物结构;

  • 通过仅改变可转动键的扭转角度而保持局部结构(键角和键长)不变,将符合生物学的配体灵活性引入模型;

  • 使用非相交损失以防止立体阻碍或不现实的范德华相互作用。

我们重点关注盲对接场景,即对蛋白质的结合位点或口袋没有任何先验知识。然而,我们的方法可以很容易地适应已知大致结合位置的情况。类似于(Zhang等人,2020),我们认为地面真实配体结合口袋构象的错误会严重影响那些以受体活性位点为条件的传统对接方法(Lang等人,2009; Trott&Olson,2010)。在实践中,结合原子的地面真实3D位置可能是低分辨率的,甚至可能完全未知(例如对于新型抗原),或者我们可能有兴趣发现蛋白质表面上以前认为是不可药用的的新的药物结合位置(例如,探索非等备位点而不是等位点位点)。

实证上,我们研究了两种设置:重对接(即将结合的配体结构从复合物中拿出来,并要求模型将其对接)和灵活的自对接(即在对接之前,配体没有结合结构的知识)。我们假设受体是刚性的,但通过首先预测变形分子的原子点云,然后使用快速算法提取可转动键扭转角度的内部变化,使其与点云最好地匹配,来建模配体的灵活性。我们使用最大化适合扭转角度的冯·米塞斯分布的对数似然,而不是使用昂贵的优化策略(例如,微分进化方法)来最小化均方根偏差(RMSD),并证明了全局最优解的闭合形式表达式。在实验中,我们展示了在各种指标上相较于普及的最新基准方法的改进质量,并以更少的运行时间。最后,我们展示了将EquiBind与现有的基于能量的方法相结合以实现混合DL方法的效果。事实上,我们相信计算药物发现的未来将遵循这里所展示的范例。


EQUIBIND: Geometric Deep Learning for Drug Binding Structure Pre的评论 (共 条)

分享到微博请遵守国家法律