论文部分内容阅读
RNA分子是存在于生物体中重要的物质,它与DNA分子和蛋白质共同协作维持生命活动的进行。作为遗传信息的重要载体之一,RNA分子在合成蛋白质、基因调控、酶催化、细胞分化等方面都起到了关键作用。快速而准确地测定出RNA二级结构能够有利于了解其实际空间结构,对于分析研究RNA分子在细胞中的运作机制、寻找同源RNA分子、提高蛋白质预测准确率等方面有着非常重要的意义。传统的测定RNA分子二级结构物理实验耗时长、成本较高,导致测定其结构存在一定的困难,不能满足研究的发展需求。针对这一问题,研究人员提出最小自由能法和比较序列分析法,其中最小自由能法最为常见,在此基础上出现了动态规划法、最大碱基配对法、茎区组合优化法等,然而这些算法效率都相对比较低。启发式优化算法常应用于解决组合优化问题,可用于预测RNA二级结构。本文重点对以最小自由能为基础的启发式优化算法的优劣进行了分析,根据RNA二级结构中是否含有假结寻求不同的启发式优化策略进行预测研究。论文首先介绍了预测RNA二级结构方法的研究现状RNA二级结构涉及的生物学概念、相关数据库和预测工具,接着比较基于启发式优化的相关算法,确定本文研究的方法,所做的主要工作如下:(1)深入研究目前应用于RNA二级结构预测领域的启发式优化算法,包括对各种算法的思想和性能优劣分析。对于非假结RNA二级结构,提出一种结合遗传算法和模拟退火算法的混合算法GSHA(Genetic Simulated Annealing Hybrid Algorithm)进行预测。(2)针对提出的GSHA算法设计相应的实验方案,通过仿真实验模拟PSTV病毒一段长度为359的序列形成二级结构的过程,将预测到的结构与RNase P结构数据库中的真实结构进行比较。实验结果分析表明,GSHA算法有着比单独使用这两种算法更高的准确率。(3)针对假结结构的特征构建假结能量模型,提出一种基于禁忌搜索的预测含假结RNA二级结构的算法TSRP(Tabu Search RNA Prediction with pseudoknot)。利用集中式搜索当前临近解空间,加入扩充式搜索保持解的完整性。选取8条含有不同类型假结的序列进行仿真实验,以RNA Predict算法作为对比实验。结果证明使用TSRP算法预测到结果的准确性、特异性以及算法的时间效率高于RNA Predict算法。