论文部分内容阅读
定量结构-性质关系(QSPR)成为化学信息学研究的热点。它主要应用统计学和理论计算的方法研究化合物的分子结构与其物理、化学性质之间的定量关系。其中快速、恰当地选择分子描述符和建立高效、稳健的数学模型一直是QSPR研究要解决的问题。本论文利用启发式方法和最佳多元线性回归来选择描述符,建立线性模型。随后为了得到更为准确的数学模型,利用径向基函数神经网络和支持向量机来建立非线性模型,结果令人满意。第一章简述了QSPR的基本原理,研究过程和最新进展。在此过程中,着重对本论文涉及到的描述符选择、模型建立的方法给出了详细描述,最后对近年来的QSPR工作进行了综述。第二章将QSPR的研究方法应用到化学领域,进而解决实际问题,主要研究工作有以下三个:建立一个QSPR模型用于研究聚氯乙烯增塑剂的塑化效率。通过启发式方法选择分子描述符,建立增塑剂效率与其分子描述符相关线性模型。该模型相关系数和留一法交互检验相关系数分别为R2=0.9527和Rcv2=0.9305。最后利用内部验证对该模型的稳定性和可靠性进行验证,得到了结果令人满意。该方法提供了一个基于分子结构预测聚氯乙烯增塑剂增塑效率的有效途径。QSPR方法应用于农药化合物定量结构性质关系的研究。利用启发式方法和径向基函数神经网络,分别建立农药化合物的正辛醇水分配系数(logKow),土壤水分配系数(logKoc)和生物富集因子(logBCF)与五个描述符的相关性模型。训练集的logKow,logKoc和logBCF的非线性模型的相关系数(Rtrain2)分别为0.9584,0.9414,0.9526,而测试集的Rtest2分别为0.9683,0.9339,0.9714。此外,利用二阶生物降解系数建立判别函数对化合物的生物降解能力进行分组,该判别函数的分组正确率达到了90%。本工作提供了一种预测物理化学和生物降解能力的。它能使人们更深入了解农药和环境间的相互关系。铯螯合物稳定常数的QSPR研究。本研究的目的是了解影响铯螯合物稳定性的结构因素。通过最佳多元线性回归、径向基函数神经网络和均匀设计优化的支持向量机分别建立了稳定常数与六个描述符间的多种相关性模型。最佳模型的训练集和测试集的相关系数分别为Rtrain2=0.8709和Rtest2=0.8560.本项工作提供了一种高效、稳定预测铯螯合物的稳定常数的新方法。这种方法将对合成大环化合物的实验提供理论指导,进而可使这些大环化合物成为一种检测环境中放射性铯污染物浓度的有效途径。