MaXFlow分子模拟与人工智能平台
Q:机器学习或深度学习的训练使用数据量大概多少,预测精确度如何?是否会使用一些已知的数据进行测试?
A: 针对不同的预测模型,我们采用权威的开源数据库进行训练,如对于逆合成路线预测,我们使用USPTO-50k数据库上的所有相关数据进行训练。对于精确度我们已经在尝试通过近期已报道的文献进行相关测评,如图所示为使用MaXFlow预测文献中化合物的合成路线与实际路线的对比,结果表明MaXFlow的预测结果与文献一致。

Q:抗原抗体对接是刚性对接吗,准确率如何?
A: 目前MaXFlow是刚性对接,采用MEGADOCK引擎,其针对特殊的抗体结构会进行构象优化。同时MEGADOCK使用多种技术减少对接所需的计算时间,例如一种新的评分函数,称为真正的成对形状互补(rPSC)评分。研究表明完成对接计算的PPI筛选,MEGADOCK的穷举能力比传统对接软件ZDOCK快7.5倍,计算结果基本一致。


Q:MaXFlow是否能够进行细致的相互作用分析?
A: 目前动力学模拟部分不仅支持基础的理化性质分析、骨架波动分析(RMSD、RMSF),还将支持蛋白质二级结构分析、热点残基分析(丙氨酸扫描、能量分解)、结合自由能分析(FEP自由能、MMPBSA)、相互作用分析(氢键分析、盐桥分析)、构象转变分析等,可以从不同角度给出相互作用全面的分析。



Q:新生成的分子模型,创新性有没有指标来评价,而且生成的分子数量很多,如何验证是否已经存在?成药性的打分标准是什么,仅仅按照(QED)来评价合理吗?
A: 为了评估生成分子的新颖性,MaXFlow通过ISOMAP算法应用于从ZINC数据库获得的训练数据集,构建从指纹到二维空间的映射,灰点代表ZINC数据库中的分子,热图点代表生成分子随时间的分布,从而实现生成新颖分子的评估。成药性指标包括类药性QED、合成性分数SAscore、水溶性指标logP以及plogP等,进一步还可通过分子对接或者药靶亲和力进行分子评价 。


Q:重链和轻链是否可以在结构上标识CDR区?
A: 抗体目前已经有了序列注释组件,包含IMGT、Kabat、Chothia和Martin四种可选编号系统对抗体进行注释,可以给序列标注CDR区。

Q:CDR优化,组件里AI模型,可以直接实现优化吗?
A:CDR区的loop因为要结合多种抗原而会具有更多样的结构,导致此区域的建模准确性更低,特别是第三个CDR loop(CDR-H3)。MaXFlow可以通过AI直接预测CDR区的loop并进行能量最小化获得更准确的CDR结构。

MaXFlow 分子模拟与人工智能平台

MaXFlow让生命科学家和材料科学家能够用最简便最快速的方式,应用模拟科学家实践的最新模拟计算和人工智能模型对创新进行机理指导和实验预测。
l 所见即所得,轻松构建3D模型
l 通过组件和工作流技术,提高建模效率
l 结合SDH科学数据基因组平台,提高数据获取效率
l 开放环境对各类算法进行集成和封装
l 降低AI模型使用门槛,模型与实验的结合更紧密
l 模型共享,专家经验与知识沉淀固化
l 加快研发速度,降低研发成本