人类基因组中选择性剪接位点的预测及序列特征分析

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:axuxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信使RNA的选择性剪接是真核生物有别于原核生物的基本特征之一。选择性剪接使单个基因产生多种转录物,是多细胞高等真核生物蛋白质多样性和功能复杂性的主要机制。mRNA前体的选择性剪接具有组织发育阶段性、特异性等特征,在系统发育、分化和癌变过程中发挥着非常重要的作用。论文首先对人类基因组中剪接位点序列与假剪接位点序列的保守性及空间结构特征进行了统计分析;其次根据剪接位点序列的碱基联体的保守性特征及剪接位点上下游区域的空间结构特征,构建剪接位点的信息向量,利用支持向量机对剪接位点的供体端和受体端进行了预测。对于供体端,5-fold交叉检验方法的敏感性、特异性及总体预测精度都达到了92.30%以上,相关系数为0.69,3-way data,split检验方法的敏感性、特异性及总体预测精度达到了91.96%以上,相关系数为0.68;对受体端的5-fold交叉检验方法的敏感性、特异性及总体预测精度都达到了90.53%以上,相关系数为0.63,3-way data split检验方法的敏感性、特异性及总体预测精度达到了89.62%以上,相关系数为0.62。   选择性剪接位点和组成性剪接位点在序列水平上没有明显的差异,而且选择性剪接位点事件中每一对选择性剪接位点之间的距离都很近,所以选择性剪接位点事件预测工作是理论预测工作的一项挑战。论文中以位置关联权重矩阵和DNA结构信息参数作为剪接位点信息输入向量,应用支持向量机对选择性剪接位点和组成性剪接位点做分类。对于供体端剪接位点,独立检验集的敏感性、特异性及总体预测精度都在73.30%以上,相关系数为0.47;对受体端剪接位点,独立检验集的敏感性、特异性及总体预测精度都在74.57%以上,相关系数为0.49。此结果要明显的好于最近的文献中的预测结果,表明我们的方法可以作为选择性剪接位点识别问题的工具之一。
其他文献
分数傅里叶变换是传统傅里叶变换在分数级次上的发展和延拓,除具有传统傅里叶变换的特点外,还具有自身的优点。对光束通过分数傅里叶变换系统传输特性的研究,在光束整形、光束质
随着全球变暖,大气污染问题日趋严重化以及常规能源供应耗尽,开发和利用可再生绿色能源已成为人类社会所面临的重大课题。今天,太阳能发电被广泛认为是一种可持续增长的、绿色可再生的能源技术,而太阳能电池已经渐渐应用于各种各样的领域,从消费电子、小尺度分布式系统到兆瓦规模的集中火力发电厂都能发现它的存在。目前,太阳能电池是以固态光伏电池为主导的。以后太阳能电池将会向低廉高效的方向发展,染料敏化太阳能电池(D
超短脉冲激光技术近些年的发展迅速,已在各方面得到了广泛的应用。人们利用超短脉冲激光作为光源,开发了时间分辨光谱技术和泵浦探测技术,包括时间分辨拉曼光谱技术、差异吸收光谱技术等。通常,产生超短脉冲的方式有高次谐波方法、受激拉曼法和频谱合成法。通过相位相互锁定频率为2f、3f的激光器,通过倍频和差频等非线性过程,在非线性晶体中产生f~6f的相位相关频率成分,进而进行频谱的合成,从而产生亚飞秒脉冲的方案
有机电致发光器件(Organic Light-Emitting Device, OLED)具有主动发光、能耗低、发光谱带宽、品种多样、制造成本低廉、轻薄、无角度依赖性等一系列优点。OLED的电致发光过
正交频分多址技术(OFDMA)又称MU-OFDM(Multi-User OFDM),多用户正交频分复用技术是基于OFDM技术的一种新的多址方式,其具有频谱利用率高、能有效对抗多径衰落等优点。OFDMA技术