利用启发式算法在三维方格网上预测蛋白质结构

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:alx0890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命活动的物质承担者,它的生物功能是由其结构决定的。成功预测蛋白质结构对进一步探索生命活动至关重要。蛋白质的三维结构是由组成蛋白质的氨基酸序列所决定的。因此,从理论上来说,蛋白质的空间结构可以通过其氨基酸序列预测出来。但从实际操作上来看,正确预测蛋白质结构却不容易。因此,该问题仍是生物信息领域的核心问题之一。  HP格点模型合理地简化了氨基酸序列,并将简化后的氨基酸序列匹配到网格中。网格中最佳匹配关系即为最稳定的蛋白质结构。目前,氨基酸序列可以在二维网格或三维网格中折叠,二维网格中的折叠结构仅仅是真实构象在二维空间的投影映射,而在三维网格中的折叠结构更接近现实。因此,本文将主要解决三维网格中氨基酸序列的折叠问题。文中根据HP格点模型在三维方格网中建立了数学优化模型。如此,本文将在三维方格网格中预测蛋白质结构这一生物问题转化为了数学优化问题。  从实际意义上分析,三维方格网中的蛋白质结构预测问题其实是氨基酸与网格格点的匹配问题。据大量文献可知,粒子群算法在求解匹配问题上已取得较好的结果。为此,本文试图采用粒子群算法求解上述问题。但基于氨基酸序列与网格格点匹配的特殊性,基本粒子群算法中的部分概念(如粒子的速度、位移等)需要被重新定义,以便算法可用于解决三维方格网中的蛋白质折叠问题。此外,为解决基本粒子群算法易早熟和收敛速度慢这两项问题,本文设计了禁忌策略和拉动策略。文中提出的两个组合优化算法,其中TPPSO1结合了改进的粒子群算法和禁忌策略,TPPSO2则由改进的粒子群算法、禁忌策略和拉动策略构成。  本文分别利用上述两种算法求解了两组氨基酸序列的结构。通过与其他方法的对比可知, TPPSO2在求解蛋白质折叠问题上更有效,同时也验证了两个优化策略有利于降低算法早熟的可能性,并可以提高算法的收敛速度。为进一步探索氨基酸突变的规律,本文利用组合优化算法分别模拟了单点突变和双点突变后的氨基酸序列。从模拟结果可看出,含有疏水氨基酸多的氨基酸序列不易受到单点突变影响,两个亲疏水性相同的氨基酸双点突变和发生在序列前后端的氨基酸单点突变更有可能影响蛋白质结构。
其他文献
随着计算机网络技术的快速发展,特别是电子商务、电子政务的不断推广与应用,人们对信息安全问题的关注程度也逐渐地提高。数字签名是顺应了信息安全技术实际与发展的要求而产
随着我国社会经济的快速发展,城市人口增多,城市机动车保有量正持续快速增加,城市道路供给已经远远不能满足于道路交通发展的需求,各类交通问题日益突出.发达国家的长期实践
本文首先从分形理论自相似集的最基本例子Sierpinski和广义Sierpinski垫片的构造出发,介绍了Sierpinski和广义Sierpinski网络的构造,然后讨论了这两类网络的一些拓扑特性。节
现代社会高速发展,每时每刻都会产生庞大的数据,寻求有效的数据处理技术、方法和手段已经成为当今世界的迫切需求。将压缩感知技术的优越性充分应用于数据处理中,不仅能够解决当
时空数据存气象环境相关的学科中很常见,时空数据随时间和空间的变化而变化,而时间和空间又分别包含很多不同的尺度。这些特点限制了传统的时空模型在处理此类数据的有效性,而分
外代数是一类有着很强应用背景的代数,在微分几何,张量分析,代数几何,拓扑学等领域有着广泛的应用,另外在交换代数以及射影空间上凝聚层范畴等的研究上有着重要应用。   虽然外
ERP自产生以来在国内外各行各业的信息化管理建设中发挥了重要的作用。在我国经济发展中,随着企事业单位的不断壮大,其面临的日益繁琐的管理需求需要高度信息化的决策管理平台,E