本文的主要作者为Yaolong Zhang, Ce Hu及Bin Jiang,研究单位为中国科学技术大学(University of Science and Technology of China)内的Hefei National Laboratory for Physical Science at the Microscale、Department of Chemical Physics、Key Laboratory of Surface and Interface Chemistry and Energy Catalysis of Anhui Higher Education Institutes。该论文发表于《J. Phys. Chem. Lett.》,发表时间为2019年8月9日。
该研究的主要科学领域为基于机器学习(Machine Learning)的高维势能面(Potential Energy Surface,以下用势能面表述)的构建及其在分子动力学(Molecular Dynamics)和复杂化学系统中的应用。势能面的准确性和高效性对于分子动力学模拟、光谱学模拟及热力学研究至关重要。然而,传统的经验或半经验力场模型(如铜嵌入原子方法,Embedded Atom Method, 简称EAM),虽然物理意义明确且计算高效,但在准确性方面存在天生的局限。此外,现有的许多机器学习势能面方法虽然在性能上优于传统方法,却在数学形式上更加复杂,对化学家理解和应用提出了较高的门槛。因此,需要一种新方法,同时兼具物理意义简单、高效且准确的特性。
本研究提出了一种新方法——嵌入原子神经网络(Embedded Atom Neural Network,简称EANN),旨在克服现有方法的局限。研究的主要目标是通过引入物理启发的表示方式,结合机器学习的建模优势,为复杂系统提供高效且精度高的势能面。
研究分为以下几个主要步骤:
EANN方法基于传统的嵌入原子方法(EAM)模型,但进行了显著改进。作者引入了一种基于高斯函数(Gaussian-Type Orbital, GTO)的密度表示取代了EAM中的标量嵌入密度。这种新方法使用了与Hartree-Fock(HF)及密度泛函理论(Density Functional Theory, DFT)中类似的描述,计算原子周围的密度贡献,并通过神经网络(Neural Network, NN)表示嵌入原子密度与原子能量之间复杂的关系。这一改进具有较高的维度扩展能力,更适用于复杂结构,包括分子和周期性固体。
描述符生成是机器学习势能面模型的关键。EANN通过基于原子轨道高斯分布的密度构建,自动包含了三体信息且无需显式总结,在保持旋转、平移和置换对称性的前提下显著降低了计算成本。文中通过方程详细描述了密度矢量的构造和算符性质,并使用了余弦截断函数使相互作用接近截断半径时平稳消失。
为验证EANN方法的准确性和高效性,研究比较了多种机器学习势能面模型(如Schnet、DeepPot-SE等)在不同系统中的性能。系统包括小型有机分子、周期性材料以及复杂多元系统(如Pt/MoS2界面、高熵合金等)。研究使用多种数据集训练模型,并通过能量和力的预测误差(Mean Absolute Errors, MAEs;Root Mean Square Errors, RMSEs)评估模型性能。模型的参数使用和训练过程被详细说明和优化。
EANN通过将密度计算的偶对求和特性显著降低了计算复杂度,相对于传统基于原子中心对称函数(Atom Centered Symmetry Functions, ACSFs)的方法(如ATNN),EANN的计算效率高出了一个数量级以上。文中通过对比描述符计算时间,验证了该方法在计算分子结构能量和力时的高效性。
准确性验证:
在多个包含有机小分子和周期性材料的数据集中,EANN取得了与Schnet和DeepPot-SE等深度学习模型相当甚至更优的预测精度。例如,EANN在既减少训练点数据量的同时,依然保持低的预测误差;对包含21个原子和4种元素的分子,EANN在能量预测上达到14.1 meV左右的误差水准,与更复杂的模型持平。
高效性验证:
EANN大幅简化了描述符计算,尤其在三体信息的隐式包含上表现显著。这使得其在预测周期性体系(如金属块体、金属表面以及金属界面)时效率极高。以Cu块体为例,EANN计算400个结构的能量与力所需时间为20.6秒,而传统ATNN方法需202.2秒。
复杂系统适应性:
在处理复杂的多元体系(如高熵合金和Pt/MoS2异质界面)时,EANN模型表现了良好的扩展性和泛化能力。高熵合金中,EANN以15%-20%的数据训练点达到了与其他模型90%训练点相当的预测精度,凸显了其较好的传递性和效率。
EANN是一种简单、高效、准确的基于物理启发的机器学习势能面模型。该方法克服了现有模型在描述符复杂性和计算效率上的局限,为计算固体和分子动力学提供了新的高效工具,其主要优势包括:
该模型的提出不仅丰富了物理化学中基于机器学习的研究工具,还为其他科学领域的势能面建模提供了普适参照。其高效性和简洁性使得非机器学习领域的化学家也可利用,展现良好的应用前景。