论文部分内容阅读
机器学习现阶段受到了各个行业的学者的关注。随着机器学习的发展,其已经不仅仅应用于人工智能等信息科学,在物理、化学、材料等领域也存在着巨大的应用前景。在技术发展的过程中,信息的传播速度快并且体量多,研究数据的增多和技术的发展促进了机器学习在各个领域的应用。 理论化学家们将机器学习的方法引入密度泛函理论(density functional theory,DFT)中,提高DFT在热化学数据计算方面的计算精度。在之前的研究中,陈冠华研究组、徐昕研究组等均已经将密度泛函理论与机器学习相结合,对密度泛函的计算结果进行后期校正,提高了生成热、异构化能、键解离能等能量的计算精度,这些方法取得了令人鼓舞的结果。在2004年,郑晓与合作者利用人工神经网络(neural network,NN)进行训练,使杂化泛函B3LYP交换相关项中的三个参数具有体系依赖性,优化了B3LYP泛函中的交换相关项,提高了B3LYP方法在生成热、电离势、质子亲合能等热化学数据上的计算的准确性,为密度泛函理论方法计算精度的提高开辟了新的思路。 本文将机器学习与长程校正(long-range correction,LC)密度泛函LC-BLYP相结合,优化LC-BLYP交换相关项中具有体系依赖性的确定长短程比例的参数μ。LC-BLYP中的参数μ与分子体系有关,我们训练得到的神经网络的权重是与体系无关的,神经网络是普适的。应用神经网络可以得到不同分子体系下不同的μ值,优化LC-BLYP中的交换相关项,提高LC-BLYP的计算精度。我们设计了简单的反向传播神经网络,基于G2/97,G3-99,HTBH38/04和NHTBH38/04中的362个分子(368个能量)组成的训练数据库来优化神经网络的权重,利用自动编码器进行分子描述算符(descriptor)的预训练作为神经网络的输入层,利用遗传算法得到训练数据库中每个分子最合适的μ值作为神经网络的输出层。在训练数据库中,应用神经网络优化LC-BLYP泛函参数后的LC-BLYP-NN方法与传统的LC-BLYP相比较,保持了传统的LC-BLYP在反应能垒计算中较高的精度,对原子化能和生成热的计算误差大幅度下降,对电离势和电子亲和能的计算精度与传统的LC-BLYP方法的计算精度相近。 此外,我们利用额外的146个分子组成测试集,验证生成的神经网络的功能。测试的结果进一步表明,LC-BLYP-NN方法与传统的LC-BLYP相比对生成热的计算精度有显著提高,对电离势和电子亲和能的计算精度变化较小,对反应能垒的计算仍保持在较高的精度。结果表明我们的神经网络是可靠的,具有较高的实用性,提高了LC-BLYP的计算精度,说明机器学习与密度泛函结合优化泛函中的参数是一个有前途的尝试,有利于密度泛函近似方法的发展。