论文部分内容阅读
无机微孔材料的应用与材料本身的多孔结构有着密切的联系,例如孔道的维数、形状和面积的不同在应用上也具有巨大的差异。无机微孔晶体由于其独特的规则孔道结构而被广泛地应用于催化、吸附、分离和离子交换等领域,因而具有新颖结构的微孔晶体的设计、合成以及新合成路线的开发一直备受关注。其中,开放骨架结构的金属磷酸盐化合物由于其结构的多样性和潜在的应用价值,国内外很多学者已经对其开展了广泛而深入的研究。无机微孔晶体化合物的合成十分复杂,材料结晶受诸多因素的影响,例如原材料、凝胶组成、PH值、模板剂、溶剂,结晶温度和时间等。对这类材料合成的研究与分析,主要困难是由于它们的合成过程难以控制、结晶机理复杂难以理解和建模。在过去几年里,科研者试图建立新的合成方法的预测模型,尤其将统计学方法应用到目标材料的定向设计中,期望得到性能较好的特定结构预测模型,用来预测新型合成材料。尽管一些统计方法在化学材料分析中已经得到了广泛的应用并取得了预期的研究成果,但是对开放骨架磷酸铝合成实验中的分析和预测的研究相对较少。鉴于开放骨架磷酸铝丰富的化学结构,本文采用基于统计的机器学习理论和方法对磷酸铝分子筛进行了大量的结构分析与预测,主要应用在:挖掘合成参数对合成产物某一特定结构的影响程度,为合成实验提供特定结构形成机理的解释;建立合成参数对产物孔道环数和产物类型的预测模型,提高定向合成实验的成功率。具体研究内容分为如下两部分:一、利用多种基于统计的机器学习方法对数据库的合成参数和产物结构进行了大量的分析与预测,具体如下:1.鉴于数据库中的合成参数之间存在严重的相关性,而偏最小二乘能够很好的解决变量间的多重共线性问题,本文采用偏最小二乘法分析合成参数对预测产物特定结构的影响程度,并采用主成分分析方法提取产物某些特定结构的综合信息,建立合成参数对产物特定结构的回归模型。2.在使用相同模板剂的合成反应中,采用BP神经网络方法分析凝胶组成及其成分组合对预测产物类型的影响程度。3.由于支持向量机能够较好的解决非线性、高维数、局部极小点等问题,本文采用支持向量机方法预测产物的孔道环数和产物类型,挖掘对生成具有特定孔道环数和特定结构类型的化学材料的模板剂参数,并采用交叉验证方法进一步提高分类器的可靠性。4.鉴于多元线性回归对变量之间不可以存在严重相关的限制,采用岭回归方法建立合成参数对产物类型的预测模型,并详细研究了岭参数和阈值的选取对预测性能影响。5.本文还采用偏最小二乘与Logistic回归结合的统计方法(PLS-LR)进行合成参数对产物类型的预测。首先采用偏最小二乘方法去除合成参数之间相关性,得到新的低维变量;然后采用Logistic回归方法在低维变量上预测产物的类型;最后通过对预测结果的影响确定偏最小二乘提取的成分个数,建立合成参数对产物类型的预测模型。大量实验与分析说明了本文采用的基于统计的机器学习方法能够挖掘出合成参数对生成产物特定结构的影响程度,并且建立了性能良好的合成参数对产物特定结构和特定类型的预测模型。二、针对磷酸铝合成数据库存在的类不平衡问题,提出了新的采样方法。数据的类不平衡问题会降低分类器的分类性能,针对预测实验中的数据存在类不平衡问题(如两类样本的比例为1:3),基于无监督的模糊C均值方法,本文提出了两种有指导的上采样方法:FCMP1,FCMP2;两种有指导的混合采样方法:FCMP1+Tomek和FCMP2+Tomek。这些方法不仅考虑了类间不平衡问题,而且考虑了类内不平衡问题,克服了现有方法的盲目采样的缺点。并且,在混合采样方法中同时去除了两类的噪音样本或边缘样本,使两类样本更具有可分性。实验结果表明,在采样后的数据集上的预测结果要明显优于原始数据的预测结果。与一些现有的采样方法相比,本文提出的采样方法展示了更好的预测性能。本文采用基于统计的机器学习方法,建立了磷酸铝合成反应数据库中合成参数对产物特定结构的一系列预测模型;为了有效的解决类不平衡问题,提出了新的采样方法来提高预测性能。本文的研究将使分子筛骨架的定向设计变得更加直接有效,减少实验成本开销,尤其对于根据功能需要定向设计具有特殊结构的分子筛骨架有重要指导意义。