基于K-最近邻、K-均值聚类和投影寻踪模式识别方法的有机物熔点的QSPR研究

来源 :山西师范大学 | 被引量 : 0次 | 上传用户:hznewblue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
化合物的熔点是其基本物理特性之一,对于有机化合物,在一定条件下有固定的熔点,它主要受分子内和分子间相互作用的影响。根据对熔点的检测可以辨认物质的本性,也可以用于测定物质的纯度。一般研究人员会通过实验的方法来获取有机化合物的熔点,或者根据某些经验方法予以估算。但对于某些有机化合物,现有的实验方法不足以测定它的熔点,因此,采用定量构效关系对有机化合物熔点的预测显得很有必要。另外,该方法可在一定程度上节约人力、经济及时间成本。定量构效关系在熔点上的研究已经取得了很多成果,选择不同的描述符,并采用不同的建模方法获得了合理的结论。在以上研究的基础上,本文扩展了对熔点的QSPR研究方法,主要研究工作包括以下几个方面。(1)本论文选择了两组数据,第一组数据是只含有C、H、O三种元素的有机酸,第二组是药物类化合物,该类化合物多数为脂类化合物,部分为酮类化合物和酰胺类化合物。两组数据均是结构较为复杂的非同系物。(2)采用ADMEWORKS ModelBuilder软件分别对两组数据进行描述符的计算和选择,然后以熔点为因变量、描述符为自变量进行定量构效关系的研究。先用稳健诊断方法(Robust Diagnostic Method)对样本进行奇异值的筛选并剔除。然后采用三种模式识别方法(K-最近邻、K-均值聚类和投影寻踪)对剩余样本进行分类。(3)在未分类样本和分类后样本中分别随机选取20%左右的样本作为外部测试集,然后将剩余样本用球型排除算法(Sphere-exclusion Algrithms)分为训练集、内部测试集。最后再采用建模方法——多元线性回归(Multiple Linear Regression)、偏最小二乘(Partial Least Squares)、人工神经网络(Artificial Neural Network)对训练集、内部测试集和外部测试集的熔点进行建模预测。(4)计算结构相似度,探究相似度对建模预测结果的影响。(5)根据误差公式计算预测值与实验值之间的误差。研究结果表明,三种模式识别方法,均可以不同程度地提高建模预测效果。从相似度的计算结果可以看出,模型的预测能力不仅与结构相似度有关,还与建模方法有关。对于三种建模方法,ANN的预测结果要优于MLR、PLS,即非线性模型的预测能力要优于线性模型。
其他文献
城市实力综合评价在城市规划,区域规划和社会经济发展规划中具有重要的意义。传统的评价方法往往只采用单一或几个指标进行评价,不能真正地反映城市综合实力指数。本文主要探讨
<正>目的通过回顾分析4例行骨桥植入术的患者资料及术后听力言语康复效果,探讨骨桥的临床初步应用。方法采用对比分析4例患者术前及术后6个月裸耳及助听情况下听力及短句、双
当代艺术家埃莱诺·贝尔纳迪的作品或怪诞新奇,或饱含深思,或传达个人感情,他对于公共艺术的探索也充满思考性。在公共领域,当代艺术家们带着问题意识,带着对时代的思考和探
能源危机以及日益严峻的环境问题,使得全社会各单位再次加大对节能减排工作的重视。电动汽车作为一种发展潜力巨大的交通工具,具有环保、节能的优势,是未来汽车行业发展的主
<正>本文对目前建筑节能领域常用的外墙保温材料和外墙保温技术进行了分析,并结合工程实践提出了适用于围护结构外墙节能改造的技术产品,期望能够为下一步大规模的既有建筑节
通过对《军队三级综合医院等级评审评审标准和细则(2011年版)》的学习和对照检查,反思医院在迎评工作中存在的不足,提出迎接等级医院评审要把握好医院的服务宗旨,确立内涵发
目前,3G网络已得到广泛部署和商用,在给人们的生活带来便利的同时也暴露出了室内建筑物信号覆盖能力较差等缺陷,TD-Femto技术应运而生。TD-Femto有效改善了3G网络的室内信号
<正> 河南省人口在国内居第二位,是人口较多的省份。耕地虽然开发量较大,但由于人口增长过快,人均不足1.4亩。且由于城市、交通非农用地日益增长,耕地锐减形势严峻。目前全省
水稻白叶枯病是由水稻黄单胞杆菌(Xanthomonas oryzae pv.oryzae)白叶枯致病变种引起的一种极易传播、发病严重的水稻“三大病害”之一。在我国,每年不同地区会受其不同程度的
交替传译中普遍存在停顿的现象,但不当停顿会导致译语产出不流畅,对信息传递以及听众理解造成障碍,应予以避免与克服。本文以“多米尼加投资与经贸机会论坛”模拟会议为例,通过对源语译语的转写与对比,选取14个典型案例,分析探讨案例中不当停顿的表现形式与成因,并提出相应的应对策略。基于前人结论与笔者实践经验,笔者将不当停顿定义为句中或句间出现的导致听众在听觉上出现中断的现象,分为无声不当停顿与包括重复、改口