利用机器学习加速高性能电池的开发

设计电池电解质的最佳成分,就像尝试为蛋糕开发新的配方。你有数十亿种潜在的配料,面临的挑战包括确定哪些成分协同效果最好,或更简单地说,是生产出可食用的产品(就电池而言,就是生产出安全的产品)。但是,即使拥有最先进的超级计算机,科学家们也无法精确地模拟每一种分子的化学特性,而这些化学特性可能成为下一代电池材料的基础。现在,美国能源部阿贡国家实验室(DOE)的研究人员已经转向借助机器学习和人工智能的力量,以大大加快电池材料的发现。


利用机器学习加速高性能电池的开发_娱乐产业_旅游达人


当前材料研究的热点方向之一是引入机器学习的方法,通过学习文献中积累下来的材料数据,建立定量的机器学习模型来预测材料性能,从而有效地提高筛选材料的效率并发现新的材料。但是对于材料科学来说,可用于训练模型的数据量通常十分有限。如何利用这有限的数据获得足够的信息来指导材料筛选成为机器学习在材料发现领域应用的一个关键挑战。


正如两篇新论文所述,阿贡国家实验室的研究人员首先创建了一个高度精确的数据库,其中包含约13.3万个可能构成电池电解质基础的有机小分子的信息。然而,这些分子只是科学家们想要探索的1660亿个分子中的一小部分。为此,他们使用了称为G4MP2的密集型计算模型。


因为使用G4MP2解析每个1660亿分子将需要大量的计算时间和计算能力,研究小组使用了机器学习算法与已知结构的小型数据集,来建模更大的数据集的结构。


其中一篇论文的作者伊恩·福斯特(Ian Foster)说:“在确定这些分子的工作方式时,要在准确性和计算结果所需的时间之间进行权衡。我们相信机器学习代表了一种获得分子图像的方法,而分子图像的精确度却只有计算量的一小部分。”


为了提供机器学习模型的基础,Foster和他的同事使用了基于密度泛函理论的建模框架,该框架是用于计算大型系统中电子结构的量子力学建模框架,计算量较少。密度泛函理论提供了良好的分子特性近似值,但准确性不及G4MP2。


改进算法,以便更好地确定更广泛种类的有机分子的信息,包括比较使用高精度G4MP2计算的分子的原子位置与仅使用密度泛函理论分析的分子的原子位置。以G4MP2为标准,研究人员可以通用加入校正因子,训练密度泛函理论模型,从而在降低计算成本的同时提高其准确性。


“机器学习算法为我们提供了一种方法,可以查看大分子中的原子与相邻分子之间的关系,了解它们如何键合和相互作用,以及寻找这些分子与我们熟知的其他分子之间的相似性。”阿贡国家实验室计算科学家、也是一项研究的作者洛根·沃德(Logan Ward)解释说:“这将有助于我们计算这些分子的焓。”


阿贡国家实验室的化学家、这两项研究的作者之一吉夫·阿萨里(Rajeev Assary)补充说:“整个项目旨在为我们提供电池电解液候选物的最大图像。如果我们要将一种分子用于能量存储应用,我们需要知道它的性质,比如它的稳定性,我们可以使用这种机器学习来更准确地预测分子的性质。”


利用机器学习加速高性能电池的开发_娱乐产业_旅游达人

论文截图


6月27日在线出版的《化学科学》(Chemical Science)上发表了题为“Accurate quantum chemical energies for 133,000 organic molecules”的论文,描述了基于G4MP2的数据集的形成过程。


利用机器学习加速高性能电池的开发_娱乐产业_旅游达人

论文截图


第二篇描述机器学习算法的论文题为“Machine learning prediction of accurate atomization energies of organic molecules from low-fidelity quantum chemical calculations”发表在8月27日的MRS Communications中。


论文链接:


Logan Ward, Ben Blaiszik, Ian Foster, Rajeev S. Assary, Badri Narayanan, Larry Curtiss. Machine learning prediction of accurate atomization energies of organic molecules from low-fidelity quantum chemical calculations. MRS Communications, 2019; 9 (3): 891 DOI: 10.1557/mrc.2019.107


Badri Narayanan, Paul C. Redfern, Rajeev S. Assary, Larry A. Curtiss. Accurate quantum chemical energies for 133 000 organic molecules. Chemical Science, 2019; 10 (31): 7449 DOI: 10.1039/C9SC02834J


73
194
0
50

相关资讯

  1. 1、蔡文胜分享心得:真实的数据与故事最能打动人2944
  2. 2、运营经验分享:如何用红包进行拉新?610
  3. 3、闲谈商品标题中的”吆喝”2854
  4. 4、关于社群持续活跃发展的几点思考2941
  5. 5、2019第五代互联网重启:覆巢之下,机遇与挑战?1027
  6. 6、【人人晚报】54期:虚拟现实来了远程办公爽翻了2153
  7. 7、Facebook的发展为何能势如破竹?4883
  8. 8、设计师如何准确找到自己的职业角色?1547
  9. 9、争夺小程序赛道:今日头条与BAT再次开战936
  10. 10、小伙,你可以用运营思维追女生的4734
全部评论(0)
我也有话说
0
收藏
点赞
顶部