DP答疑交流活动第三期:DeePMD-kit参数设置
2023-07-06 12:12 作者:halfway_right | 我要投稿


训练模型


05:13

输入局域原子坐标
经过数学处理得到R矩阵
经过嵌入神经网络得到G矩阵
G矩阵经数学构造得到满足不变性的描述子D
描述子D经过拟合神经网络最终预测能量
08:51
第一次上手可以只修改下图中的参数

更细致的:

模型选择:有碳的时候可能需要局域角度信息,需要用三体描述符se_e3模型(描述符引入了很多角度信息)
sel:截断半径内最多原子数
rcut:经验上6-9(对能量敏感或者不那么局域性的话调高一些,但初始训练6就够了,后期再根据情况调到8或者9,9的时候计算量比较大了) 不需要根据盒子大小调整rcut
19:42


训练步数:第一次尝试可以设置10w-40w区间内;DPGEN:40-80w,因为最开始不太需要那么高精度的模型,通常只是需要一个还可以的模型来快速补充训练数据;最后的最后,在所有工作都完成,数据收集也基本完成的时候,最后收尾时可能需要把所有数据再重新高精度算一遍来做最后的能量精度提升以降低与DFT计算的误差,此时numb_steps可能需要数百万甚至更多(尤其是对能量敏感的,例如弹性常数,是一个对能量的二阶导量,可能对能量收敛精度要求更高,需要更多的step)
这个步数设置其实是batch的个数
dpmdkit2.0不会自动提供测试集数据,需要自己额外提供,默认传入的数据都是训练数据