论文部分内容阅读
蛋白质构象优化算法是制约蛋白质结构预测精度的关键环节,从头计算现已成为蛋白质构象优化的主要方法。从计算学科的角度来看,从头计算方法实质就是选择一种蛋白质力场模型作为目标函数,利用全局优化算法在势能曲面上搜索全局最低能量构象解。蛋白质力场模型考虑分子体系成键作用及非成键作用,致使其形成的势能曲面极其粗糙,局部极小值数随着问题维数的增加呈指数增长。在数学上称为一类难以解决的多重极小值问题,在计算科学上属于一类非常难解的NP-Hard问题。蛋白质构象优化问题的研究,从生物学意义上,可以揭示蛋白质分子折叠的规律,进行蛋白质功能注释,为新型材料和基因药物的设计和研发提供理论依据;从算法意义上来讲,实际问题是算法研究的推动力和源泉,通过对实际问题的求解,检验已有算法,并开发新的算法。从上述两个方面来讲,本文的研究具有重要的科学意义和工业应用前景。本文主要工作和研究成果如下:1.综述了蛋白质结构预测产生的背景及发展现状,针对目前蛋白质结构预测领域面临的高维构象空间优化问题,详细介绍了分子构象优化算法的研究现状与发展趋势,重点分析了常见的构象优化算法的发展过程和存在的不足。2.针对一类同质原子基态构象优化问题,提出了一种适于求解高维多模优化问题的局部限制差分进化算法,通过在差分进化算法的接受阶段引入有限次的局部搜索过程及下降方向变异策略,在保证解全局最优性的前提下可有效的增加算法收敛速度。对硅和砷原子的Tersoff半经验多体势数值研究结果表明,算法在收敛速度和可信度方面均优于原先的差分进化算法,适合求解大规模高维优化问题MBP6/As和MBP6/Si。3.针对蛋白构象优化问题,基于ECEPP/3力场转换模型,提出了一种基于局部能量极小化和片段集结过程的差分进化算法。在进化算法的框架下,通过在交叉算子中引入片段集结过程策略,在不牺牲算法多样性的前提下,增强算法的局部收敛能力;基于拟牛顿(Qausi Newton)能量极小化算法,进一步降低势能曲面的粗糙度,达到简化模型的目的。最后,通过甲硫氨酸—脑啡肽(TYR’-GLY2-GLY3-PHE4-MET5)构象空间优化实例验证了算法的有效性。4.考虑到蛋白质构象优化的多模态特性,初步提出基于广义凸下界估计模型的改进差分进化算法。首先,基于广义凸理论,利用差分进化算法中更新个体的适应度知识,建立并证明了原优化问题的广义凸下界估计模型,设计实现了基于N-叉树的估计模型快速计算方法;其次,综合考虑原问题目标值与其估计值之间存在的差异,提出了一种基于有偏采样的小生境指标,并设计区域进化树更新策略来保证算法的局部搜索能力。数值实验结果表明,提出算法能够有效地发现并维持一定数量的满意解模态,动态实现全局模态搜索到模态内局部增强的自适应平滑过渡。对于文中给出的测试问题,能够发现所有的全局最优解以及一些较好的局部极值解。由于时间的关系,设计的多模态优化算法尚未对蛋白质具体的实例进行数值研究,但这些工作对我们下一阶段的研究尤为重要。5.最后,对全文的研究工作进行了总结,给出了本文的研究成果以及存在的不足之处,并展望了蛋白质构象优化领域的发展方向以及下一步工作开展的方向。