应用神经网络方法优化密度泛函近似中的半经验参数

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:niujicun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习现阶段受到了各个行业的学者的关注。随着机器学习的发展,其已经不仅仅应用于人工智能等信息科学,在物理、化学、材料等领域也存在着巨大的应用前景。在技术发展的过程中,信息的传播速度快并且体量多,研究数据的增多和技术的发展促进了机器学习在各个领域的应用。  理论化学家们将机器学习的方法引入密度泛函理论(density functional theory,DFT)中,提高DFT在热化学数据计算方面的计算精度。在之前的研究中,陈冠华研究组、徐昕研究组等均已经将密度泛函理论与机器学习相结合,对密度泛函的计算结果进行后期校正,提高了生成热、异构化能、键解离能等能量的计算精度,这些方法取得了令人鼓舞的结果。在2004年,郑晓与合作者利用人工神经网络(neural network,NN)进行训练,使杂化泛函B3LYP交换相关项中的三个参数具有体系依赖性,优化了B3LYP泛函中的交换相关项,提高了B3LYP方法在生成热、电离势、质子亲合能等热化学数据上的计算的准确性,为密度泛函理论方法计算精度的提高开辟了新的思路。  本文将机器学习与长程校正(long-range correction,LC)密度泛函LC-BLYP相结合,优化LC-BLYP交换相关项中具有体系依赖性的确定长短程比例的参数μ。LC-BLYP中的参数μ与分子体系有关,我们训练得到的神经网络的权重是与体系无关的,神经网络是普适的。应用神经网络可以得到不同分子体系下不同的μ值,优化LC-BLYP中的交换相关项,提高LC-BLYP的计算精度。我们设计了简单的反向传播神经网络,基于G2/97,G3-99,HTBH38/04和NHTBH38/04中的362个分子(368个能量)组成的训练数据库来优化神经网络的权重,利用自动编码器进行分子描述算符(descriptor)的预训练作为神经网络的输入层,利用遗传算法得到训练数据库中每个分子最合适的μ值作为神经网络的输出层。在训练数据库中,应用神经网络优化LC-BLYP泛函参数后的LC-BLYP-NN方法与传统的LC-BLYP相比较,保持了传统的LC-BLYP在反应能垒计算中较高的精度,对原子化能和生成热的计算误差大幅度下降,对电离势和电子亲和能的计算精度与传统的LC-BLYP方法的计算精度相近。  此外,我们利用额外的146个分子组成测试集,验证生成的神经网络的功能。测试的结果进一步表明,LC-BLYP-NN方法与传统的LC-BLYP相比对生成热的计算精度有显著提高,对电离势和电子亲和能的计算精度变化较小,对反应能垒的计算仍保持在较高的精度。结果表明我们的神经网络是可靠的,具有较高的实用性,提高了LC-BLYP的计算精度,说明机器学习与密度泛函结合优化泛函中的参数是一个有前途的尝试,有利于密度泛函近似方法的发展。
其他文献
AMG-319是安进公司(Amgen Inc.)开发的一种PI3Kδ抑制剂。目前的研究表明,这种药物具有优异的物理化学性质,而且有很强的选择性,在人体全血中的IC50仅有16nM。目前,AMG-319的合成路
早在20世纪60年代,科学家们就开始研究过渡金属参与的有机小分子的C-H键活化反应,在过去的几十年中,许多重要的发现被相继报道出来。其中脱氢是活化反应中的常见过程之一,被认为
艺术表现形式可谓多种多样,而“舞台主持”作为其中的特殊门类自有其独到之处。与一般的广播电视主持大有不同,身为舞台主持人,就要对自己有严格的要求与明确的角色定位。本文对舞台主持人其个人素质的提高提供了切实可行的方法,也对舞台主持人与主持的内容、与观众的距离、与多人主持搭档间的角色定位进行了阐述。  【关键词】舞台主持;舞台主持人;角色;自我定位  主持人能否发挥其关键性作用决定着一台晚会的成功与否,
本论文总共分为两章:第一章:研究背景在这一章中,我们首先介绍了 α-二茂铁基甲基吡唑衍生物的应用前景。并且归纳了 α-二茂铁基甲基吡唑衍生物现有合成方法的局限性,让我们感受到发展一种新型合成方法的迫切性。随后,我们对2-取代-1,3-二酮的合成路线作了简要的分析。在最后,我们结合α-二茂铁基烷基胺中碳-氮单键断裂的实例,更深层次了解了 α-二茂铁基烷基胺亲核取代的构型保持特性。第二章:α-二茂铁基