《自然-通讯》无监督机器学习指导发现新型快锂离子导体

十九世纪三十年代,法拉第在研究固体导电性的时候发现,当氟化铅和硫化银被加热到红热时,这两种物质会从绝缘体突变成很好的导体。这可能只是法拉第伟大生涯中的一个不起眼的发现,但却从此揭开了离子导体研究的序幕。现在人们知道,和传统导体导电依靠电子的自由迁移不同,这两种物质的导电性是由氟离子和银离子的快速移动而实现的。经过近两个世纪的研究,越来越多的离子导体被发现。它们包含了基于锂、钠、钾、银、铜、质子等的各种阳离子导体,和基于氟,氯,氧等的阴离子导体。这些丰富的离子导体也带来了包括锂离子电池、钠离子电池、固态燃料电池、固态气体感应器等等一系列非常优越的应用前景。在最理想的情况下,如果一个锂离子导体能够替代锂离子电池中的有机易燃电解液,就有可能给解决锂离子电池的安全性问题甚至提高能量密度提供一个可能的方案。这也让对固态锂离子导体的研究成为了一个当前的重要热点。
近两个世纪的研究揭示出了很多固态离子导体需要具有的特征,比如高浓度可自由移动的离子和低的扩散势垒等等。但目前尚没有一个能有效利用这些原理来筛选材料的方法。这让新离子导体的开发目前很多时候还停留在以经验为基础的实验试错上,包括近十来年新发现超锂离子导体,如Li10GeP2S12 (LGPS)和石榴石结构的Li7La3Zr2O12 (LLZO)等。在这样的情况下,如何利用人类已知的材料知识来快速地发现及筛选筛选新的高性能材料成为材料科学的一个重要问题和材料基因组工程的动机。
当前材料研究的热点方向之一是引入机器学习的方法,通过学习文献中积累下来的材料数据,建立定量的机器学习模型来预测材料性能,从而有效地提高筛选材料的效率并发现新的材料。以离子导体为例,如果能训练一个机器学习模型能够通过一些材料特征来预测离子导电率,那么就可以有的放矢的针对那些被预测为高电导的材料开展进一步的实验。
遗憾的是,理想很丰满,现实很骨感。众所周知,机器学习是一个建立在数据分析上的学科方法。足够的数据量是保证模型预测准确度的前提。但是对于材料科学来说,可用于训练模型的数据量通常十分有限。以锂离子导体为例,多年来的研究才仅仅发现了约十余种不同类型的锂离子导体和一些较差的离子导体材料。如何利用这有限的数据获得足够的信息来指导材料筛选成为机器学习在材料发现领域应用的一个关键挑战。
为了解决这个难题,来自丰田北美研究院和马里兰大学的研究者们提出了一种全新的应用机器学习的思路,通过较少的材料数据来筛选并发现新的高性能材料。和通常使用机器学习建立从材料特征到材料性质之间的定量关联不同的是,他们提出利用无监督学习的方法来建立一个对材料的分类,在此基础上分辨出哪个类别中具有较好的材料特征和想要的材料性能,然后引入高通量计算的方法来深入预测该类别中包含材料的性质。和监督学习相比,无监督学习不需要大量的材料性质做为训练数据,从而避免了应用机器学习需要大量数据的难题。

以该工作中展示的锂离子导体为例(图1),他们首先利用模拟X-射线衍射的方法把修正后的阴离子晶体构型表现为一个数值矢量,作为机器学习的特征。随后,他们利用hierarchical clustering建立了根据该阴离子构型衍射特征的分组。从中,他们发现已有的锂离子导体绝大多数集中于两个相邻分组(图2)。通过改变分组算法和优化分组目标函数,他们发现这种利用材料衍射作为特征能够稳定地分类固态锂离子导体。这种稳定的衍射-离子导体关联揭示阴离子构型在决定锂离子固态扩散中的重要作用。通过进一步分析,他们发现绝大多数锂离子导体都处于有高度对称的阴离子构型和高度不对称的阴离子构型之间。从而他们认为这种居中的对称性有利于形成能级相近的锂离子位,从而为快速的离子扩散创造条件。

无监督学习揭露的这种隐藏的定型关系是作为进一步材料筛选的基础。研究者们引入第一性原理分子动力学(图3),系统地预测并筛选了包含有已知锂离子导体分组内的材料,从中预测了十六个新的室温导电率大于0.1 mS/cm的材料,其中最高的室温导电率接近10-1 S/cm。值得一提的是这些材料和已知锂离子导体相比具有显著不同的化学成分和晶体结构,为下一步快锂离子导体研究提供了基础和指导。

该工作发表于Nature Communications 上,通讯作者分别是马里兰大学的莫一非教授和丰田北美研究所的首席科学家凌晨博士。
Ying Zhang, Xingfeng He, Zhiqian Chen, Qiang Bai, Adelaide M. Nolan, Charles A. Roberts, Debasish Banerjee, Tomoya Matsunaga, Yifei Mo* & Chen Ling* “Unsupervised discovery of solid-state lithium ion conductors” 10, 5260 (2019)
https://doi.org/10.1038/s41467-019-13214-1

作者介绍
莫一非教授研究组位于马里兰大学材料科学与工程系(University of Maryland, College Park)。莫一非教授研究组致力于发展与使用先进材料计算技术来理解、设计与发现高性能材料。该课题组现阶段的研究重点是能量储存与转化材料,例如全固态电池。研究组的相关文章发表在Nature, Science, Nature Materials, Nature Communications, Journal of the American Chemical Society, Angewandte Chemie, Joule, Advanced Energy Materials, Chemistry of Materials, Physical Review B 等期刊上。课题组常年招生秋季及春季入学的博士研究生、博士后研究人员和访问学生学者。
凌晨博士毕业于佐治亚理工学院。自2011年加入丰田以来,他的主要研究方向在于利用第一性原理和机器学习方法进行对各种功能材料设计和机理研究。研究范畴包括对电池材料,汽车尾气催化剂,电化学催化剂,太阳能电池材料等的设计开发,机器学习在材料学中的应用,文本挖掘等。研究结果发表在Nature Communications,Chemistry of Materials,npj Computation Material,Journal of Materials Chemistry A等期刊上。他目前是丰田北美研究所的Principal Scientist,负责其中的材料信息学课题组。