拟南芥poly(A)位点的特征提取和识别算法

来源 :厦门大学 | 被引量 : 0次 | 上传用户:caonima_0720
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物mRNA的3’-UTR对基因表达具有十分重要的调控作用,其主要特征是在转录后的mRNA前体3’末端分裂处(poly(A)位点)加入一串腺嘌呤尾巴,这是mRNA成熟过程中的一个关键步骤,称为多聚腺苷化(polyadenylation,简称poly(A))。Poly(A)对mRNA的稳定性、可翻译性及从核到细胞质的运输性都有决定性作用,并且是基因表达调控的一个枢纽。在基因组分析中,对poly(A)位点的正确识别有助于确定基因编码的终止位置,对分析基因的转录过程及探索基因表达的调控机制都起着十分重要的作用。哺乳动物poly(A)位点信号比较保守,AAUAAA所占比例达约55%左右。而植物poly(A)的顺式元件保守性差,最佳特征序列AAUAAA也仅占总数的10% ,同时普遍存在多位点现象。因此目前辨识植物poly(A)位点的机制完全依赖于对带有poly(A)尾巴的表达序列标签的识别。然而,由于表达方式的不同及EST数据的不完整性,许多poly(A)位点无法被明确地识别出来,甚至在许多情况下被错误标识。至今为止,国内外相关文献绝大多数都是针对动物poly(A)位点进行研究,而对于植物poly(A)位点,至今尚未出现除应用生物实验以外的识别方法的正式文献报道。本文在“植物poly(A)位点识别研究课题组”的原有模型的基础上,进行模式植物拟南芥poly(A)位点的特征提取和识别算法研究。首先,使用基于熵的算法及熵值分析法对poly(A)位点上下游周围序列进行特征提取,并对采用支持向量机的位点分类方法进行研究。然后以提取出的特征为基础,改进原模型,加入一阶异构马尔可夫子模型,改进分值公式,并将位点识别范围由TA和CA两种模式扩展到所有可能的双联子情况。同时将HMM标定技术引入GHMM,解决了模型的计算精度问题。为方便多位点序列的测试,编制了EST数据集多位点判别整合程序。最后将原有模型与上述改进相结合,构建了poly(A)位点计算机识别系统:Poly(A)Sleuth(简称PAS)。应用PAS对大量mRNA序列进行位点识别实验,实验数据表明,PAS识别的敏感度和特异度的最优组合分别由原模型的0.81和0.84提高到0.88和0.91,达到可以有效辅助生物实验进行位点辨识的水平,更重要的是,PAS能较准确地对突变后的poly(A)位点的使用效率提供量化评估。
其他文献
随着科技不断进步,仅仅对一台电机的控制远远不能满足现代工业发展的要求,而是要求控制多台电机,一起同步运行。研究多电机同步控制系统对理论研究和实际生产具有重要的意义。本文以3台永磁同步电机(permanent magnet synchronous motor,PMSM)速度同步控制系统为研究对象,提出了一种改进型偏差耦合速度补偿结构与非线性积分型滑模控制策略相结合的同步控制策略,主要包括以下几个方面
红外半实物目标仿真装置是研制红外制导系统的一种有效试验工具。定向镜伺服系统是红外目标仿真装置中的几个伺服系统之一,是一个能实现方位运动和俯仰运动的微型双轴转台。
现代电力系统中,大型发电机-变压器组(以下简称发变组)大量投入运行。发变组一旦发生故障,将会造成巨大损失。故障录波系统为分析故障原因、故障性质,研究反故障措施提供了直
随着假日旅游规模和范围的逐渐扩大,旅游产业已成为许多地区的支柱产业,由于旅游管理和旅游信息化的发展速度严重落后于旅游规模的发展速度,旅游信息化已经成为制约旅游管理、旅
冷轧薄板是钢铁工业中具有高附加值的深加工产品,生产管理水平的提高是冷轧薄板企业增加效益的必要途径。本文以上海宝钢益昌薄板有限公司为研究背景,在综述了钢铁企业ERP的发
针对传统轻水堆事故源项计算方法不适用池式钠冷快堆的问题,分析可能发生的设计基准事故和超设计基准事故的释放路径,研究建立适用于池式钠冷快堆的堆芯损伤类、泄漏类和钠火
近十年来,子带滤波器组的理论和设计受到广泛的关注,使得子带滤波器组的理论和应用成为数字信号处理领域中一个非常活跃的研究课题,而同时,越来越多的研究者关注于子带滤波器组的
变电站是电力输送和调配的枢纽,电气设备故障会造成严重的电力问题,甚至会酿成火灾,给人们生活带来不便和造成巨大的经济财产损失。针对当前面临的电气设备故障发现不及时,火灾报警误差大的缺陷提出了基于多传感器监测变电站电气设备的方法。从电气设备的视频监测和变电站内火灾预防两方面进行学习研究,视频监测中采用红外光传感器和可见光传感器,红外传感器能监测电气设备的发热信息,间接反应设备的运行状况,可见光传感器能