基于mRNA等融合特征的单定位和多定位细胞凋亡蛋白质亚细胞定位预测

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:zydwnj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息学的飞速发展,出现了大量的未知功能的蛋白质序列,其中细胞凋亡蛋白质得到研究人员越来越多的关注。在生命体中,细胞凋亡蛋白质的异常可能导致多种疾病的发生。这些蛋白质的功能与它们在细胞中的位置紧密相关,因此,准确的预测出细胞凋亡蛋白质的亚细胞位置能更好的了解其功能。  本文构建了新的细胞凋亡蛋白质数据集,其中包含单定位数据集、多定位数据集以及以单定位为标准的含mRNA信息的mRNA-蛋白质数据集。在单定位预测中,通过特征筛选提取了氨基酸物理化学特性、氨基酸粘性特征和进化信息,并结合了两种mRNA信息:三阅读框3-mer mRNA序列频数信息、mRNA二级结构-序列模式信息,最后将各特征信息融合,利用支持向量机的算法,对四种不同亚细胞位置的细胞凋亡蛋白质进行预测。研究发现融合mRNA信息后预测效果更佳,在Jackknife检验下预测总精度达到82.18%,且独立测试集预测总精度达到78.26%。结果表明,mRNA的序列和结构特性有助于提高细胞凋亡蛋白质的亚细胞定位预测精度。  多定位预测中,考虑到序列相似性对预测的影响,采用CD-HIT软件将单定位与多定位数据集的序列相似性降至80%以下,筛选出氨基酸二肽组分信息、蛋白质骨架信息、氨基酸物理化学特性和进化信息作为特征参数,采用离散增量的算法对多定位细胞凋亡蛋白质进行预测,融合特征的总体位置准确率能达到79.57%。
其他文献
混床技术是把一定比例阳、阴离子交换树脂混合装填于同一离子交换装置中,从而实现对流体中的阴、阳离子同时进行交换或脱除的目的。S-TR惰性树脂没有离子交换作用,相对密度一