基于DNA结构特性的启动子预测方法研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:yyl273518021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几年中,已经完成了多个物种基因组的测序计划,对这些已经完整测序的基因组进行详细的注释变得越来越重要,而识别核心启动子是基因组注释中最具挑战性的工作之一。核心启动子包含了指导转录起始所必需的DNA序列,因此识别核心启动子是我们理解转录调控机制的重要方面,也是研究基因表达模式和构建基因调控网络的必要步骤。  现有的识别核心启动子的实验方法价格昂贵、耗时长,而且通常不能识别没有转录活性的启动子,因此研究者开始探索使用计算机从头预测的方法在指定的基因组序列上定位启动子区域。目前已经提出了多种启动子预测方法,但是由于启动子序列变化多样,现有方法在基因组范围内的预测精度仍然不能满足要求。主要是因为现有方法提取的特征不能有效地区分启动子序列和非启动子序列;另一方面,没有考虑转录开始位点簇对预测结果的影响。  针对以上问题,本文提出了一种基于DNA结构特性谱的Markov链模型,使用统计模型对启动子和非启动子序列进行建模,以更好地区分启动子和非启动子。本文利用结构特性区域平均值谱与 TSS簇的相关关系提出了一种初步定位可能TSS簇区域的算法,然后在这些区域内,对预测位点的得分进行加权,从而抵消邻近位点的干扰,提高预测算法整体的效果。  实验结果表明:本文的方法优于EP3和ProSOM,具有较强的泛化能力,能在检出率和正确率上达到良好的平衡,取得最佳的总体性能;另外,本文的方法在不同的染色体上的效果都是一致的,这说明本文的方法具有较强的稳定性。
其他文献
随着无线网络技术的不断进步,移动互联网应用正在以前所未有的速度向前高速发展,使得人们可以随时随地访问互联网。然而多媒体技术作为移动互联网中的重要应用对带宽资源、网
流星突发通信(MBC)是一种利用流星电离余迹反射电波实现数据传输的通信方式,它以其通信距离远、截获概率低、抗干扰和抗毁性等优点在突发通信领域中得到广泛的关注,同时由于
合成孔径雷达成像已经成为雷达新的发展趋势,它具有全天候、全天时、远距离和高分辨成像等特点。自20世纪50年代发明以来,至今已获得飞跃式发展,以飞机为平台的机载SAR已被广
无线传感器网络是一种特殊的无线自组织网络,该网络是在监测区域内部署大量低成本的微型传感器节点,这些节点依靠协作的方式通过多跳将监测到的数据发给观察者。本文对大规模
红外与可见光的异源图像融合作为图像理解和计算机视觉领域的重要技术,可以综合红外图像较好的目标指示特性与可见光图像较清晰的场景信息,为观察提供了一个有效的方法。本文
学位
自组织网络以其独立组网、无中心、自组织等优点逐渐被应用于军事通信和个人通信等通信领域;但由于其多跳路由、动态拓扑以及无线信道固有的干扰、衰落等缺陷,导致自组织网络
突发通信是一种新型通信体制,其主要思想是尽可能地缩短通信信号在空间的暴露时间,它能有效提高通信系统抗截获和抗干扰能力。流星余迹通信作为突发通信的代表,具有突发通信
网络编码具有增加网络的传输容量,提高网络的吞吐量,增强网络的鲁棒性等优点。网络编码的基本原理是在网络节点上对接收到的多路数据进行线性或非线性的编码处理,然后再发送