欢迎光临散文网 会员登陆 & 注册

J CHEMINFORMATICS | COMA:有效的结构约束分子生成使用收缩和边际损失

2023-06-13 10:18 作者:AIDDPro  | 我要投稿


今天给大家讲一篇2023年1月在Journal of Cheminformatics上发表的一篇关于目标导向的生成模型的文章,该模型具有两个训练阶段:首先,基于对比损失及边际损失的方法来进行结构约束学习分子表征;其次,通过强化学习方法优化分子结构来改善目标属性。通过与各种最先进的基准模型进行比较以及消融研究证明了该设计方法的优越性。此外,作者用耐药患者中索拉非尼为例进行分子设计来证明了该方法在药物发现中的应用价值。

目标导向分子生成研究背景

基于结构约束的分子生成方法旨在通过施加结构约束生成具有提升目标化学性质的新分子。因此,这个方法可以作为一种有效的策略来优化分子设计和发现过程。在有机化学中,传统的方法通常包括识别与目标生物实体(如激酶)相关联的分子亚结构,并对分子基序修饰从而发现潜在活性的新型候选药物。深度生成模型在如VAE、GAN网络等通过贝叶斯优化、粒子群优化和强化学习可以以特定的理化性质运用于基于结构约束的分子生成过程。例如,JTVAE和VJTNN是基于图的分子生成模型,它们将变分自编码器与连接树结合来学习分子的结构信息从而改进其特定目标属性。这些传统方法已经被广泛应用于药物发现和优化领域,并仍然是当今药物设计的重要组成部分。

COMA模型介绍

2.1  COMA设计流程

其流程如图1所示,作者首先根据具有提升属性的分子对进行正负样本划分,将源分子或者目标分子与其小于相似性阈值的分子定义为负样本对,反之为正样本对。然后通过设计两个具有基于SMILES的VAE结构分别引入对比损失和边际损失使得结构相似的分子具有相似的潜在向量,从而鼓励解码器有效地生成与源分子类似的新颖分子。并采用了基于属性值作为奖励的强化学习算法来集中生成具有理想属性的分子。

图1 COMA设计流程

实验结果

3.1 对比损失和边际损失的消融实验

如图2所示,作者在DRD2基准数据集上进行了消融实验,首先随机选择了10个分子对,并定义两个分子对集合,其一是二者谷本相似度大于0.4,其二是小于0.4,并用主成分分析(PCA)计算分子对的欧氏距离值在源分子和目标分子相应的嵌入向量,并比较二者之间的距离分布。两种分布之间的偏差是用Kruskal-Wallis-H检验测量的,H统计值较高意味着具有相似结构的成对分子彼此接近,成对的不同分子位置较远。可以看出只有在同时使用对比损失和边际损失时,才能识别出潜在空间中的理想分子嵌入分布

图2 消融实验

3.2 基准方法比较理化性质

如图3所示,作者将JTVAE, VJTNN, VJTNN+GAN, CORE等模型与COMA在logP04、logP06、QED和DDR2四个任务上进行比较。评价指标为成功率,即衡量一个模型同时满足三个约束(新颖结构、改进的属性和结构相似性)生成有效分子的比例。COMA模型在几个阈值条件下与基准模型具有同当或更好的性能,因此认为COMA能够生成比基准模型更高相似性约束(0.55–0.70)的分子。为了进行定量比较,还计算了相似度阈值上的平均成功率,可以得出COMA对DRD2、QED、pLogP04和pLogP06的比例分别为0.180、0.301、0.154和0.213。

图3 基准方法比较

3.3 对接实验比较

作者评估了生成的分子在ABCG2和BRAF上的对接姿态。首先用Open Babel生成配体的三维坐标,并将分子在pH值为7.4时质子化,再用Meeko 0.3.0制作PDBQT文件。进一步,为每个受体-配体对产生20个姿态,并选择了每个受体-配体对得分最低的姿势来和索拉非尼进行比较。其中亲和力是由DeepPurpose预测得到的,由图4可知,ABCG2上的数个分子的亲和力低于索拉非尼,并且具有高相似性分数。

图4  生成分子与Sorafenib亲和力比较

结论

目前的深度生成模型在设计同时生产满足分子属性提升、并且与源分子有高相似性分数的分子方面存在局限性。作者提出了一种新的基于结构约束的深度生成模型COMA(VAE架构),该模型通过对比损失和边际损失让VAE学习如何生成与源分子相似的分子。这个阶段的目标是确定哪些分子被认为是“相似”的,并且将那些相似的分子编码于VAE中,从而让模型重构出更多与源分子相似的结构。

强化学习阶段,VAE学习如何生成符合所需增强属性的分子。这个阶段使用强化学习算法来最大化VAE生成的分子的提升属性值,并基于奖励值来更新VAE的权重参数。COMA在四个基准数据集上(DRD2、QED、plogP04和plogP06)的表现优于各种最先进的模型。在未来或将运用提出的对比损失和边际损失实现将生物活性相似性代替结构相似性的先导化合物优化工作。参考文献

Chen Z, Min MR, Parthasarathy S, Ning X (2021) A deep generative model for molecule optimization via one fragment modifcation. Nat Mach Intell 3(12):1040–1049

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn


J CHEMINFORMATICS | COMA:有效的结构约束分子生成使用收缩和边际损失的评论 (共 条)

分享到微博请遵守国家法律