量子化学在量子尺度上研究化学性质和过程,为现代化学的研究和发现开辟了许多途径。化学家不需要使用烧杯或试管,就可以研究某一特定原子或分子的电子结构,它们是如何排列在轨道上,以及这些电子如何与其他化合物或原子的电子相互作用,来预测给定原子或分子的性质,以及它将如何发生化学反应。
然而,尽管量子化学已经显示出强大的威力,但它也有一个很大的缺点:精确的计算是资源密集型和耗时型的,常规化学研究涉及到数天甚至更长时间的计算。
现在,多亏了一种使用机器学习的新量子化学工具,量子化学计算的速度可以比以前快1000倍,从而使精确的量子化学研究比以往任何时候都要快。
这个名为OrbNet的工具是由加州理工学院的化学教授tommiller和Bren计算和数学科学教授animaanandkumar合作开发的。
米勒说:“在量子化学中,计算的准确性和所需时间之间存在着一种相互影响的相互作用。”你可以开始计算,然后说,‘好吧,星期二见。’但现在,计算可以交互进行了。”
OrbNet使用了一个图形神经网络,一种机器学习系统,它将信息表示为“节点”,其中包含数据,而“边”表示这些数据块之间的关联方式。
米勒说,OrbNet之所以能像现在这样工作,是因为在原子和分子映射到图形神经网络的方式上有了创新,这种网络是以薛定谔方程为基础的,薛定谔方程是量子力学的核心数学。
他说:“以前的图结构把原子组织成节点,把原子之间的键组织成边,但量子化学并不是这样想的。”因此,我们建立了一个图,其中节点是电子轨道,边是轨道之间的相互作用。这与薛定谔方程有着更为自然的联系。”
像所有的机器学习系统一样,OrbNet需要经过培训才能执行指定的任务,这与获得新工作的人需要如何为此接受培训类似。OrbNet学会了在精确参考量子力学计算的基础上预测分子性质。Anandkumar的研究重点是机器学习,他帮助设计和优化了图神经网络的实现。
Orbnet是一个很好的例子,它使用特定领域的特性:在本例中,是分子轨道。这使得机器学习模型能够精确地计算出比训练数据中的分子大得多,高达10倍的分子对于一个标准的深度学习模型,这种外推是不可能的,因为它只学习在训练数据上插值。利用分子轨道的领域知识对我们实现向大分子的转移至关重要。
目前,OrbNet已经对大约100000个分子进行了训练,Miller说这使得它能够为研究人员执行许多有用的计算,但是正在进行的努力旨在将其扩展到更大的训练数据集。
“分子性质的预测有许多实际的好处。例如,OrbNet可以用来预测分子的结构,它们的反应方式,它们是否溶于水,或者它们如何与蛋白质结合,”他说。
米勒说,未来在OrbNet上的工作将集中在通过额外的培训来扩大其任务范围。
他说:“我们已经证明了这种方法在有机化学的一个小角落起作用,但没有什么能阻止我们将这种方法扩展到其他应用领域。”
参考文献:Zhuoran Qiao et al. OrbNet: Deep learning for quantum chemistry using symmetry-adapted atomic-orbital features, The Journal of Chemical Physics (2020). DOI: 10.1063/5.0021955。