论文部分内容阅读
随着人类基因组计划的完成以及蛋白质工程研究的日益深入,蛋白质分子构象空间确定与功能的研究已成为分子生物学领域中最具有挑战性的问题之一。根据Anfinsen原则,以计算机为工具,运用适当的算法,从氨基酸序列出发,直接预测蛋白质的空间结构,是当前生物信息学中非常活跃的一个研究课题。本质上,蛋白质从头预测方法在数学上属于一类全局优化问题,通过选择一种合适的优化方法,对构象空间进行快速搜索,从而得到与某一全局最小能量对应的稳态构象。由于蛋白质构象空间优化问题具有极高的计算复杂度,现有全局优化方法在稳定性、高效性、广普性和易用性等方面还远不能满足实际求解需求,必须针对问题模型的特点设计高效、可靠的全局优化算法。本文主要工作和研究成果如下:(1)综述了蛋白质结构预测产生的背景及发展现状,针对目前蛋白质结构预测领域存在的高维构象空间优化问题,详细介绍了分子构象优化算法的研究现状与发展趋势,并分析给出了常见的构象优化算法及其优缺点。(2)详细介绍了现有的分子力场模型,重点介绍了ECEPP/3力场模型基础知识及其笛卡尔与二面角转换算法。(3)针对蛋白质结构从头预测问题,基于Windows XP平台,采用C++面向对象程序设计语言,设计并实现了一种经典的蛋白质结构优化算法—构象空间退火算法(Conformation Space Annealing, CSA)。运行结果表明,可以得到脑啡肽在ECEPP/3力场模型下的公认最低能量结构。(4)基于ECEPP/3力场转换模型,提出了一种基于差分进化算法和构象空间退火的多模态混合优化算法(CSA-DE)。在构象空间退火算法多模态框架下,在扰动策略中引入差分进化操作,在不牺牲算法多样性的前提下,增强算法的局部收敛能力;同时利用拟牛顿(Qausi Newton)能量极小化算法,进一步降低势能曲面的粗糙度,达到简化模型的目的。在低维问题中,三个测试问题数值研究结果表明,算法在收敛速度和可信度方面均优于其他优化算法;在高维问题下,脑啡肽构象空间优化实例计算结构也表明了该算法的有效性。最后,对全文的研究工作进行了总结,给出了本文的研究成果以及存在的不足之处,并展望了蛋白质构象优化领域的发展方向以及下一步工作开展的方向。