欢迎光临散文网 会员登陆 & 注册

权威力作!上海科技大学/理论大佬Kirsten M. Ø. Jensen再发子刊!

2022-10-13 10:38 作者:唯理计算  | 我要投稿

秋去冬来,北风凛冽,科研人宅在实验室捣鼓实验;

寒来暑往,四季更替,计算人猫在电脑前拨弄数据!

  1. Nature Communications:基于吸附化学环境的多相催化机器学习框架

图片

多相催化反应,受到原子尺度因素微妙的相互作用的影响,从催化剂的局部形态到高吸附剂覆盖率的存在。通过计算模型描述这种现象,需要生成和分析大空间的原子构型。在此,为了解决这一挑战,来自美国特拉华大学的Siddharth Deshpande & 普渡大学的Jeffrey Greeley提出了基于吸附物化学环境的图卷积神经网络(ACE-GCN),一种筛选工作流,考虑了包括不同吸附物结合位置配位环境基底形态原子构型。利用这个工作流程,研究者为两个说明性系统开发了催化剂表面模型:(i) NO吸附在Pt3Sn(111)合金表面,这与硝酸盐电还原过程有关,其中高吸附剂覆盖层结合合金基底的低对称性产生了一个大的构型空间;(ii) OH*吸附在阶梯Pt(221)小面上,与氧还原反应有关,其构型复杂性源于不规则晶体表面的存在、高吸附剂覆盖层和定向依赖的吸附剂-吸附剂相互作用。在这两种情况下,ACE-GCN模型只训练了DFT弛豫构型的一小部分(~10%),成功地描述了从大构型空间中采样的非松弛原子构型的相对稳定性趋势。这种方法,有望加速对原位条件下催化剂表面的严格描述的发展。

图片

参考文献:

Ghanekar, P.G., Deshpande, S. & Greeley, J. Adsorbate chemical environment-based machine learning framework for heterogeneous catalysis. Nat Commun 13, 5788 (2022). https://doi.org/10.1038/s41467-022-33256-2

原文链接:

https://www.nature.com/articles/s41467-022-33256-2


2.Nature Machine Intelligence:基于Transformer的蛋白质生成与正则化潜空间优化

图片

强大的自然语言模型的发展,提高了学习蛋白质序列有意义表示的能力。此外,高通量突变、定向进化和下一代测序技术的进步,使得大量的标记适应度数据的积累成为可能。在此,来自美国耶鲁大学的Smita Krishnaswamy等研究者利用这两种趋势,引入了正则化潜空间优化(ReLSO),这是一种基于深度变压器的自编码器,其特点是高度结构化的潜空间经过训练可以联合生成序列和预测适应度。通过正则化预测头,ReLSO引入了一个功能强大的蛋白质序列编码器和一种有效的适应度景观遍历的新方法。使用ReLSO,研究者显式地对大型标记数据集的序列-函数景观建模,并使用基于梯度的方法在潜在空间内进行优化,从而生成新分子。研究者在几个公开可用的蛋白质数据集上评估了这种方法,包括抗拉尼珠单抗和绿色荧光蛋白的变体集。研究观察到,与其他方法相比,使用ReLSO具有更大的序列优化效率(每个优化步骤的适应度增加),在其他方法中,ReLSO更健壮地生成高适应度序列。此外,联合训练的ReLSO模型学习到的基于注意力的关系,为序列级别的适应度归因信息提供了一个潜在的途径。

图片

参考文献:

Zhaobo Zhou, Junjie He, Thomas Frauenheim, Oleg V. Prezhdo, and Jinlan Wang. Control of Hot Carrier Cooling inLead Halide Perovskites by Point Defects. Journal of the American Chemical Society Article ASAP DOI: 10.1021/jacs.2c08487

原文链接:

https://pubs.acs.org/doi/10.1021/jacs.2c08487


3.npj Computational Materials:(001)氧化物超晶格的涌现拓扑态

氧化物异质结构,表现出许多有趣的特性。在此,来自上海科技大学的Gang Li & 华东师范大学的Hanghui Chen等研究者,提出了在(001)(AMO3)1/(AM’O3)1氧化物超晶格诱导多种拓扑态的设计原则。通过第一性原理计算和模型分析,研究者发现a (SrMO3)1/(SrM’O3)1超晶格(M = Nb, Ta和M’= Rh, Ir)是Z2指数(1;001)的强拓扑绝缘体。更值得注意的是,a (SrMO3)1/(SrM’O3)1超晶格具有多重共存的拓扑绝缘体(TI)态和拓扑狄拉克半金属(TDS)态。TDS态在费米能级附近有一对ii型狄拉克点和对称保护狄拉克节点线。表面TDS狄拉克锥在能量动量空间中被两个表面TI狄拉克锥夹在中间。非平凡拓扑性质来自于两个不同的过渡金属原子d轨道之间的带反转和(001)超晶格几何的特殊宇称性。该工作演示了如何通过合理设计,在(001)钙钛矿氧化物异质结构中诱导非平凡拓扑态。

图片

参考文献:

Liu, Z., Liu, H., Ma, J. et al. Emergent topological states via digital (001) oxide superlattices. npj Comput Mater 8, 208 (2022). https://doi.org/10.1038/s41524-022-00894-5

原文链接:

https://www.nature.com/articles/s41524-022-00894-5


4.npj Computational Materials:非松弛结构松弛能量图神经网络学习的数据增强

图片

由于计算能力和晶体结构预测算法(CSPA)的进步,计算材料的发现在过去十年中有了很大的发展。然而,CSPA所需从头计算的计算成本,将其效用限制在小单元,减少了算法可以探索的成分和结构空间。过去的研究通过利用机器学习来预测材料的稳定性,绕过了不必要的从头计算。具体来说,在松弛结构的大型数据集上训练的图神经网络,在预测地层能量时显示出了高保真度。不幸的是,CSPA生成的结构几何图形偏离了松弛状态,导致预测效果不佳,阻碍了模型过滤不稳定物质的能力。在此,来自美国佛罗里达大学的Jason Gibson & Ajinkya Hire & Richard G. Hennig等研究者,为了纠正这种行为,提出了一种简单的物理驱动的计算效率高的扰动技术,该技术增强了训练数据,将对非松弛结构的预测提高了66%。最后,研究者展示了这种误差减少是如何加速CSPA的。

图片

参考文献:

Gibson, J., Hire, A. & Hennig, R.G. Data-augmentation for graph neural network learning of the relaxed energies of unrelaxed structures. npj Comput Mater 8, 211 (2022). https://doi.org/10.1038/s41524-022-00891-8

原文链接:

https://www.nature.com/articles/s41524-022-00891-8


5.npj Computational Materials:利用可解释机器学习从纳米结构的对分布函数数据中提取结构基序

图片

利用X射线或中子散射来描述材料结构,例如使用对分布函数(PDF)分析,通常依赖于根据实验数据集细化结构模型。然而,确定一个合适的模型,往往是一个瓶颈。最近,自动化方法已经可以为每个数据集测试数千个模型,但这些方法计算成本高,分析输出(即以有意义的方式从结果拟合中提取结构信息)具有挑战性。在此,来自丹麦哥本哈根大学的Kirsten M. Ø. Jensen等研究者,基于机器学习的Motif Extractor (ML-MotEx),在数千个拟合上训练ML算法,并使用SHAP (SHapley Additive exPlanation)值来识别哪些模型特征拟合质量重要。研究者将该方法用于4种不同的化学体系,包括无序纳米材料和簇。ML-MotEx可用于一种建模类型,其中模型中的每个特征都被分配一个基于可解释ML的拟合质量的重要值。

参考文献:

Anker, A.S., Kjær, E.T.S., Juelsholt, M. et al. Extracting structural motifs from pair distribution function data of nanostructures using explainable machine learning. npj Comput Mater 8, 213 (2022). https://doi.org/10.1038/s41524-022-00896-3

原文链接:

https://www.nature.com/articles/s41524-022-00896-3

权威力作!上海科技大学/理论大佬Kirsten M. Ø. Jensen再发子刊!的评论 (共 条)

分享到微博请遵守国家法律