智源论坛 | 王涵:基于深度学习的分子动力学数值方法

2019 年 5 月 9 日,由北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)主办的“智源论坛——人工智能的数理基础”系列报告第一场开锣。论坛当日,北京⼤学副研究员王涵分享了其在人工智能数理基础领域的研究探索。
王涵来自北京应用物理与计算数学研究所,他的报告主题为《Deep Learning for Multiscale Molecular Modeling》,重点探讨了基于深度学习的分子动力学数值方法,介绍了深度学习在多尺度分子建模中独特且有趣的应用,以及过程中遇到的问题。

首先什么是分子模拟,概念非常简单,假设这个世界由原子构成,我们将每一个原子看作一个质点,然后依据牛顿运动第二定律,给定初值以后就能把这个方程解出来,从而获知所有原子在任意时刻的坐标,这就是分子模拟在做的事。但是大家如果看过《三体》,马上就会意识到这个方程要想精确求解,只能针对两原子体系,任意一个多原子体系都无法在无穷长的时间内把这个方程精确地解出来,或者说你的初值误差就会变得非常大,导致你的解完全不靠谱。
但我们想要通过分子模拟得到的并非原子运动的轨道,而是原子运动的轨道在无穷长时间内对相空间的作用。所谓相空间是什么?就是所有原子的坐标构成的一个空间。如果有 n 个原子写在一起,我们想研究这个轨道在 n 空间中的分布,在这种情况下,数值误差对这个分布的影响实际上是可以控制的。如果我们的离散做得足够好,我们得到的结果就能够和物理中想要的分布一致,这就是分子模拟一个最基本的理念,或者说是我们正在做的事情。

这里方程已经写出来了,但我们还不知道每一个原子的受力,每个原子的受力写成公式实际上就是这个能量的负梯度,能量就是依赖于所有原子的。假设一个体系里有n个原子,知道坐标后就能把体系能量写出来,同时对任意一个原子坐标求负梯度,就能知道原子的受力。我们所谓的分子建模,就是把能量函数的E给写出来。多尺度分子建模就是说对这个原子坐标做一定的粗粒化,然后怎么样写出一些等价的形式。

这里的 E 本质上是多维函数,多维函数在传统数学的手段上处理起来还是比较困难的,正好深度学习为我们处理多维函数提供了非常有利的工具,这也是我们研究的出发点。
稍微回顾一下分子建模或解能量函数E的传统方法,包括两种套路,其一是从头算,就是把体系中的电子结构给解出来,就像刚才邵老师讲的,从学薛定谔方程出发,把体系中所有电子的结构解出来,这样的话自然就获得能量函数 E。其优点在于出发的模型几乎没有任何假设,能量 E 可以解得非常精确,甚至和实验对得非常好;缺点则是非常昂贵的,典型的大家能够算得起的体系实在是太小了。另外一种套路就是经典力场建模,假设E有某种比较简单的函数形式,实际上是显式的函数形式,当然里面带了一些参数。我猜出这种函数形式,然后我去套参数,使得这个 E 尽可能的靠谱。这么做的好处当然是快,但是缺点就是精度非常有限。而我们的思路就是用深度学习去解决这个问题,我们希望达到的目标就是能够在保证第一性原理计算的精度条件下,做到计算开销和经典力场尽可能合并。
王涵及其合作者发展了基于深度学习的原子间相互作用建模方法——深度势能,提出通过模型一致性估计深度势能模型误差的方法,在本质上改善了原子间相互作用的建模精度。深度势能的模型精度达到与第一性原理计算一致,同时计算开销的阶由 O(N3) 降低到 O(N),其中 N 为体系中原子个数。数值实验表明,在约 100 个水分子的模拟中,深度势能的计算开销比第一性原理计算节省将近 5 个数量级,极大地提高了计算效率。
英国皇家学会外籍院士 Parrinello 使用深度势能分子动力学方法研究硅的熔化,克服了传统原子间相互作用模型无法同时精确刻画硅的固相和液相的困难。北京师范大学的崔刚龙教授课题组对深度势能模型进行了扩展,用于对非绝热激发态分子动力学建模,克服了传统方法在能量面交接锥处模型精度低的难题,获得了和第一性原理一致的激发态动力学模拟结果。
关于主办方

北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)是在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动成立,依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研究机构。