基于启发式优化的RNA二级结构预测方法研究

来源 :江苏大学 | 被引量 : 4次 | 上传用户:ekinhushuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA分子是存在于生物体中重要的物质,它与DNA分子和蛋白质共同协作维持生命活动的进行。作为遗传信息的重要载体之一,RNA分子在合成蛋白质、基因调控、酶催化、细胞分化等方面都起到了关键作用。快速而准确地测定出RNA二级结构能够有利于了解其实际空间结构,对于分析研究RNA分子在细胞中的运作机制、寻找同源RNA分子、提高蛋白质预测准确率等方面有着非常重要的意义。传统的测定RNA分子二级结构物理实验耗时长、成本较高,导致测定其结构存在一定的困难,不能满足研究的发展需求。针对这一问题,研究人员提出最小自由能法和比较序列分析法,其中最小自由能法最为常见,在此基础上出现了动态规划法、最大碱基配对法、茎区组合优化法等,然而这些算法效率都相对比较低。启发式优化算法常应用于解决组合优化问题,可用于预测RNA二级结构。本文重点对以最小自由能为基础的启发式优化算法的优劣进行了分析,根据RNA二级结构中是否含有假结寻求不同的启发式优化策略进行预测研究。论文首先介绍了预测RNA二级结构方法的研究现状RNA二级结构涉及的生物学概念、相关数据库和预测工具,接着比较基于启发式优化的相关算法,确定本文研究的方法,所做的主要工作如下:(1)深入研究目前应用于RNA二级结构预测领域的启发式优化算法,包括对各种算法的思想和性能优劣分析。对于非假结RNA二级结构,提出一种结合遗传算法和模拟退火算法的混合算法GSHA(Genetic Simulated Annealing Hybrid Algorithm)进行预测。(2)针对提出的GSHA算法设计相应的实验方案,通过仿真实验模拟PSTV病毒一段长度为359的序列形成二级结构的过程,将预测到的结构与RNase P结构数据库中的真实结构进行比较。实验结果分析表明,GSHA算法有着比单独使用这两种算法更高的准确率。(3)针对假结结构的特征构建假结能量模型,提出一种基于禁忌搜索的预测含假结RNA二级结构的算法TSRP(Tabu Search RNA Prediction with pseudoknot)。利用集中式搜索当前临近解空间,加入扩充式搜索保持解的完整性。选取8条含有不同类型假结的序列进行仿真实验,以RNA Predict算法作为对比实验。结果证明使用TSRP算法预测到结果的准确性、特异性以及算法的时间效率高于RNA Predict算法。
其他文献
随着信息技术的迅猛发展,许多服装企业建立了自己的管理信息系统,积累的数据量也越来越大。如何从海量的数据中提取有用的信息,为企业提供决策依据,是管理者迫切需要解决的问题。
随着网络技术的飞速发展以及网络应用的层出不穷,互联网用户对网络服务的可靠性、安全性、多样性都提出了更深层次的要求。路由器需要提供有差别的网络服务才能满足不同用户
网格[1]作为一种新型的网络计算平台,是建立在Internet上的一种新型的信息技术基础设施。它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,实现计算
基于客户机/服务器架构的新的网络计算模式——透明计算能够有效降低用户使用和维护计算机系统的成本,并且其客户主机的各种性能甚至与同配置的有存储硬件的PC机相当,从而在
基于计算机视觉进行物体的三维建模属于非接触式的三维测量,在Internet应用、逆向工程以及工业检测等各个方面有着非常广泛的应用需求,其操作简便、不需要与物体进行接触等优
在自然界中,对称性是非常普遍的,无论是细胞、粒子的微观结构,还是宇宙中的太阳系和其他星体,都存在不同程度的对称性。而人类对于对称性的感知也是非常强烈的,因此人造物体
模型驱动体系架构(MDA)是由对象管理组织(OMG)提出的一种新的软件体系架构,它以模型为核心,模型转换为关键技术,通过模型间的转换来驱动整个软件开发。其中,模型转换是MDA开
在车辆行进过程中进行测距是近年来国内外相关方面的学者们非常感兴趣的研究课题。车辆自动测距系统包括三部分:图像采集及预处理;在含有车辆的复杂背景中确定车辆的位置;对车辆
近年来,随着Ad Hoc网络的不断发展,Ad Hoc接入网成为研究的热点之一。目前研究者们主要采用对Ad Hoc网络单播路由协议进行扩展等方案来实现Ad Hoc接入网。由于多播路由技术可
视频目标跟踪是计算机视觉领域的核心问题,在民用和军事上都有着广泛的应用,如智能监控、人机交互、机器人导航、以及制导武器等,近年来,随着信息技术的高速发展,目标跟踪吸