海归学者发起的公益学术平台
分享信息,整合资源

交流学术,偶尔风月
材料技术的革命通常起源于新材料的发现。对于组成相同,结构多样的材料,其能量是有区别的,通常能量较低的更稳定,比如石英(SiO2)就有多种结构,室温下以α-石英最稳定,而β-石英等是亚稳定。如果定义稳定或亚稳定化合物的组成为化学相关组成(CRC),那么实现对CRC的预测就意味着获得了新的材料。
Fig. 1 The yearly trend of the number of unique compositions registered in ICSD (2021 Ver.2) for ternary and quaternary ionic compounds (orange bars).
从理论计算的角度看,搜索化CRC就是根据给定的组成尝试搭建各种结构,然后寻找形成能的局部极小值。然而这类计算除了巨大的资源消耗,得到的局部极小值也不意味这种组成就可以通过这些能量相应的结构而客观存在。其中一个主要的原因是常用的第一性原理计算得到的是0K时的结果,而实际可用的材料应当是室温稳定或亚稳定的,需要进一步中考虑声子与组态的作用,计算耗费更加庞大,因此更常用的办法是通过机器学习,利用已知化合物来推测未知的新化合物。因此如何挖掘并利用两者之间 “相似性”就成了一个挑战性问题。
Fig. 2 The numbers of verified CRCs for pseudo-binary compositions with the ranking of the recommendation scores. 
推荐系统是淘宝等电商平台采用的一种信息过滤型系统。利用日常交易中获取的大量购买信息,推测特定顾客的喜好或可能需求,然后将对应的商品推荐给他。它是通过已有或已发生的购买需求来预测未来的或未发生的购买需求,这与通过已知的化学相关组成来推测未知的化学相关组成有着共通之处。
Fig. 3 Candidate CRCs on the Li2O-GeO2-P2O5 pseudo-ternary system with chemical compositions registered in three databases, i.e., ICSD, ICDD-PDF, and SpMat.
来自日本的东京大学材料科学与工程系与日本精细陶瓷中心纳米研究实验室的Isao教授团队基于这种共通点,模仿并建立了预测新无机化合物CRC的推荐系统,将顾客的购买历史替换成已知化合物的CRC,此时向顾客推荐商品的有效性就对应着某个未知CRC的存在可能性。
Fig. 4 Schematic illustration of matrix- and tensor-based recommender systems.
其中已知化合物的组成取自无机晶体结构数据库(ICSD)中的二元和三元化合物。推荐系统使用的机器学习方法有两种:组成描述子法和张量分解法。预测结果的有效性通过粉末衍射数据库或批量的第一性原理计算来检测,并且抽取了高推荐分数的两个三元体系,以固相反应法进一步进行合成验证,分别成功获得了一个新的结构和一个已有结构衍生的新产物。
Fig. 5 The cumulative numbers of verified CRCs with the ranking of the recommendation scores for ternary, quaternary and quinary systems.
另外,虽然预测结果的检验表明张量分解法的推荐效率较高,但是这种优势会受限于用作训练的数据数量,如果数据越多,组成描述子法的性能也会提高的。
Fig. 6 The convex hull of the formation energy by the DFT calculations for pseudo-binary-oxide systems containing candidate CRCs.
最后,该团队还利用平行合成法获得了一批合成条件数据,以此建立有关预测合成条件的推荐系统,其机器学习法采用张量分解法。利用所推荐的合成条件也成功制备了两种未知的赝二元氧化物。基于推荐系统的机器学习为充分利用“相似性”来实现新材料及其合成条件的的预测提供了新的思路,相比于盲目的、全局性的搜索具有更高的效率。该文近期发表于npj Computational Materials 8: 217 (2022)。
Fig. 7 A synthesis-condition recommender system.
论文链接:
https://www.nature.com/articles/s41524-022-00899-0
继续阅读
阅读原文