欢迎光临散文网 会员登陆 & 注册

MONN: 预测化合物与蛋白质相互作用和亲和力的多目标神经网络

2023-08-23 20:55 作者:AIDDPro  | 我要投稿

引言

今天为大家带来的是西湖大学曾坚阳团队的文章。阐明化合物-蛋白质相互作用(CPIs)的计算方法对于推动药物开发非常重要。目前阐明化合物-蛋白质相互作用的方法有:

1.基于结构的方法

分子对接(如 AutoDock Vina、GOLD)和分子动力学(MD)模拟是研究 CPIs 广泛使用的基于结构的方法。这些方法可以预测潜在的结合位置和结合亲和力。但是,它们也有局限性:- 它们在很大程度上依赖于蛋白质靶标的三维结构- 它们需要大量的计算资源

2.无结构的方法

为了解决基于结构的方法的局限性,研究人员开发了无结构模型。这些模型旨在预测 CPI,而无需依赖明确的三维结构。这类模型的例子包括基于相似性的方法和基于深度学习的方法:基于相似性的方法:利用相似性矩阵作为化合物和蛋白质的描述符。它们侧重于全局相似性,但忽略了详细的分子组成。基于深度学习的方法:利用深度学习技术捕捉化合物结构和蛋白质序列的局部特征,从而预测结合亲和力这些无结构模型的目标是在不需要原子分辨率结构的情况下深入了解 CPIs 并预测结合亲和力,从而为筛选大型化学空间和加速药物发现提供更有效的方法。然而,这些方法缺乏对已识别局部特征可解释性的系统评估。此外,这些方法还没有解决确定化合物和蛋白质中相互作用位点之间精确匹配的难题,而这正是理解药物作用机制的重点。本文作者引入了一种名为 MONN(多目标神经网络的新方法,旨在同时预测化合物与蛋白质之间成对的非共价相互作用和结合亲和力。这种方法旨在通过有效捕捉局部和全局分子特征来提高 CPI 预测的准确性。MONN有以下几个创新点:

  • 统一学习框架: 作者将成对非共价相互作用和结合亲和力的预测合并为一个单一的机器学习问题。他们构建了一个全面的基准数据集,其中包含 10,000 多个化合物-蛋白质对,使他们能够系统地评估神经注意机制的可解释性。

  • 无结构模型: MONN 是一个无结构模型,这意味着它不依赖于明确的三维结构。它将化合物和主要蛋白质序列的图表示作为输入。这种设计使其在处理大型数据集时具有可扩展性和计算效率。

  • 图卷积网络和卷积神经网络: MONN 采用图卷积网络和卷积神经网络(CNN)来处理输入信息。这些网络可提取全局化合物层面和局部原子层面的特征,从而增强了模型捕捉分子特征的能力。

  • 成对相互作用预测模块: MONN 包含一个专门用于预测化合物原子与蛋白质残基之间成对非共价相互作用的模块。该模块得益于从高质量的三维化合物-蛋白质复合结构中提取的标签,从而提供额外的监督。

  • 整合相互作用信息: 预测的成对非共价相互作用结果被整合到结合亲和力预测模块中。这使得 MONN 能够有效利用化合物和蛋白质特征之间的共享信息,从而进行更准确的亲和力预测。

作者在他们构建的基准数据集上进行了全面的交叉验证测试,证明即使在使用无三维结构信息的情况下,MONN 也能成功地学习成对非共价相互作用。此外,他们还利用蛋白质数据库(PDB)的外部测试数据集验证了 MONN 的泛化能力。结果表明,在预测结合亲和力方面,MONN优于其他最先进的无结构模型

方法

MONN 的网络结构旨在通过捕捉非共价相互作用和结合亲和力来预测化合物与蛋白质之间的相互作用。该架构由四个主要模块组成。

1.图卷积模块

该模块处理化合物的分子图,提取单个原子和整个化合物的特征。输入的原子特征最初使用代表各种原子特性的单次编码进行编码。然后通过单层神经网络对这些特征进行转换,以获得更新的原子特征。图卷积在多个层上迭代执行,更新原子特征并生成代表整个化合物的超级节点特征。为加强信息共享和全局特征提取,还加入了图翘曲单元。

2.CNN 模块

使用 BLOSUM62 矩阵对蛋白质序列进行编码,该矩阵对氨基酸之间的进化关系进行编码。采用泄漏 ReLU 激活的一维卷积层用于更新从 BLOSUM62 矩阵获得的初始残基特征。该模块沿蛋白质序列提取单个残基的特征。

3.成对相互作用预测模块

该模块预测化合物原子和蛋白质残基之间非共价相互作用的概率。它使用转换后的原子和残基特征来计算相互作用概率,该概率基于内积,并通过一个 sigmoid 函数进行归一化。通过该相互作用矩阵可以深入了解预测的相互作用位点。

4.亲和力预测模块

该模块整合了来自原子特征、残基特征和预测的成对相互作用矩阵的信息。原子和残基特征通过单层神经网络进行转换,并用于计算注意力权重。基于注意力的聚合可创建化合物和蛋白质特征表征。这些表征与预测的相互作用矩阵相结合并进行处理,以预测化合物与蛋白质之间的结合亲和力。

图 1. MONN 的架构概览。给定一对化合物-蛋白质,首先使用图卷积模块和卷积神经网络(CNN)模块分别从输入的分子图和蛋白质序列中提取原子和残基特征。然后,成对相互作用预测模块对提取的原子和残基特征进行处理,得出成对相互作用预测矩阵,从而构建化合物原子和蛋白质残基之间的联系。最后,亲和力预测模块用于整合来自原子特征、残基特征和之前得出的成对相互作用信息,从而得出预测的结合亲和力。

MONN 的结构包括:

  • 利用图卷积从分子图中提取原子和化合物特征。

  • 利用一维卷积从蛋白质序列中提取残基特征。

  • 利用相互作用概率预测成对的非共价相互作用。

  • 结合原子和残基特征以及相互作用矩阵预测结合亲和力。

这种综合架构旨在捕捉化合物-蛋白质相互作用的局部和全局特征,从而有助于准确预测结合亲和力和相互作用位点。利用基准数据集和来自蛋白质数据库(PDB)的独立数据集对该模型的性能进行了系统评估,并与最先进的方法进行了比较。MONN 展示了卓越的预测能力,为了解化合物与蛋白质相互作用的机制提供了见解,从而有助于推进药物发现过程。

结果

在本文的这一部分,作者评估了他们提出的多目标神经网络(MONN)模型在预测化合物与蛋白质之间成对的非共价相互作用和结合亲和力方面的性能。他们指出了神经注意在捕捉此类相互作用方面的局限性,并建议使用额外的监督信息来指导模型的预测。

1.成对非共价相互作用预测的性能

作者证明,与基线方法相比,MONN 在预测成对非共价相互作用方面的性能有所提高。在不同的交叉验证设置和聚类阈值下,MONN在皮尔逊相关性和均方根误差(RMSE)方面都优于最先进的基线方法。MONN的多目标变体同时包含成对相互作用标签和结合亲和力标签,其性能略优于单目标变体

2.结合亲和力预测的性能

作者将 MONN 与各种最先进的结合亲和力预测模型进行了比较。它的表现始终优于这些模型,获得了更高的皮尔逊相关系数和更低的均方误差值。在不同的交叉验证设置和数据集上,MONN 的性能依然强劲。

3.泛化能力和大规模验证

使用一个独立的化合物-蛋白质相互作用数据集对MONN的泛化能力进行了验证。结果表明,MONN 在该数据集上保持了其预测能力。此外,还在大规模无结构数据集上对 MONN 的性能进行了评估,结果表明,即使在没有结构数据的情况下,MONN 的性能也超过了其他基线方法4.捕捉全局分子特性作者研究了 MONN 捕捉与相互作用位点疏水性有关的全局分子特性的能力。他们发现,MONN 对蛋白质中疏水相互作用位点的预测与化合物的疏水性有很强的相关性5.捕捉化学相互作用规则该研究考察了MONN是否能够自动捕捉非共价相互作用的化学规则。MONN 展示了为化合物中不同类型的原子正确识别首选相互作用伙伴的能力,例如氢键供体和受体,以及π-堆积相互作用的芳香残基。总之,MONN 在预测化合物与蛋白质之间的成对非共价相互作用和结合亲和力方面表现出强大而有效的性能,超越了现有的先进方法。它有效地捕捉了分子特性和化学相互作用规则,展示了其作为药物发现和化合物-蛋白质相互作用研究的强大工具的潜力。

参考资料:Li, Shuya et al. "MONN: A Multi-objective Neural Network for Predicting Compound-Protein Interactions and Affinities", Cell Systems 10.4 (2020): 308-+.

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn


MONN: 预测化合物与蛋白质相互作用和亲和力的多目标神经网络的评论 (共 条)

分享到微博请遵守国家法律