蛋白质四级结构预测

来源 :南开大学 | 被引量 : 0次 | 上传用户:h135zy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质在生物的生命活动中处于核心的地位,而蛋白质的作用与其结构又紧密相关,要想弄清某个蛋白质所发挥的作用,首先必须要先弄清楚蛋白质的结构,因此蛋白质的结构信息的研究是生物信息学研究中的一个重点。蛋白质的结构一般分为四个层级:一级结构、二级结构、三级结构及四级结构。一级结构是指蛋白质的氨基酸序列,二级结构是指蛋白质主肽链的局部空间排布,三级结构是指整个多肽链的三维空间结构,四级结构是指蛋白质所包含的多肽链的个数。对于某些较大的具有四级结构的蛋白质而言,其功能与其四级结构密切相关,而随着蛋白质结构数据的越来越多越来越快地被检测出,蛋白质四级结构预测是一个比较有挑战同时又具有重要意义的研究问题。蛋白质的一级结构包含着蛋白质其它高级结构所需要的全部信息,而最早通过氨基酸序列来预测蛋白质四级结构的工作是由Garian做出的,2001年Garian开发出了第二个用一级结构预测四级结构的软件Quaternary Structure Explorer(QSE)。后来的学者也在Garian探索的基础上,展开了许多研究。而本文试图提出一个较为有效的预测蛋白质四级结构的方法Quat-PRE。本文提出的Quat-PRE方法,首先从蛋白质四级结构数据库PiQSi中选出适当的蛋白质序列数据集,然后结合氨基酸的各种统计信息和物化性质将蛋白质序列转化为定长的特征向量,之后综合运用特征筛选的mRMR方法和基于SVM的wrapper方法做若干组的特征筛选,再通过SVM对筛选出的几组特征数据集做五倍交叉验证,选出综合表现效果最好的特征作为Quat-PRE方法所要提取的序列特征,通过SVM对未知序列进行四级结构预测。同时为证明Quat-PRE方法的有效性,对Quat-PRE方法做了独立集测试并与Garian提出的预测同源与非同源二聚体的QSE方法进行了比较。本文的Quat-PRE方法在训练集上通过五倍交叉试验得到的预测准确率为49.11%,比随机预测的16.67%高近33个百分点,在独立集上的预测准确率也达到了39.3%,亦比随机预测的准确率高出一倍多。另外,将本文的Quad-PRE方法与Garian提出的QSE方法进行了比较,结果无论从预测正确率上还是从ROC曲线上,都证明Quad-PRE方法要优于Garian的QSE方法。以上结果充分证明,本文提出的Quad-PRE方法在预测蛋白质的四级结构方面是有一定效果的。
其他文献
自明中叶以来,随着珠算取代筹算并成为主要的运算方式,算筹这种曾经为中国古代数学做出杰出贡献的古老算具便逐渐消失了.由于算筹多为竹木制作,不易在地下保存,故尔长时间内,
时间:5月25日$$ 地点:北京师范大学敬文讲堂$$ 为什么要反思发展经济学?$$ 成功的国家为什么都是出口导向的?成功的国家为什么是政府跟市场共同作用的?$$ 发展经济学
报纸
在广泛阅读国内外土石坝抗滑稳定设计资料的基础上,总结归纳了国内外土石坝抗滑稳定分析方法研究现状及力学原理,并对其中四种典型的方法进行了分析和比较.
目的:探讨颌面部植入物在消毒供应中心的安全管理,预防植入物不良事件的发生。方法:严格植入物的准入,加强护理人员有关植入物知识培训,制定植入物的清洗、消毒、包装、灭菌
我国是一个农业大国,14亿人口中8亿多是农民。我国总人口占世界的21%,而耕地面积却只占世界的7%,中国在不到全球7%的耕地上解决了占世界21%人口的吃饭问题,这是一件了不起的工程,
Rhino配合Vray在产品的造型设计上,既能严谨精确的制作出三维模型,又能渲染出真实细腻的设计效果,是工业设计领域最快速有效的三维组合。 Rhino with Vray in the product d
用硬质合金YG6和高速钢W18Cr4V为切削刀具,研究了碳化硅颗粒增强ZL201复合材料中的碳化硅颗粒含量及其尺寸等参数对切削加工性能的影响。试验结果表明:碳化硅颗粒尺寸越大、碳化硅含量越多,对刀
译者在进行翻译的过程中面对的是异族文化,译者的任务主要就是应该传达这种文化的差异。文化的表现主要在于带有文化内涵的字、谚语以及俗语等方面。可见,在对跨文化文本进行阐
文章以水库径流调节和水库下游河流的水文情势关系为研究对象,定性分析水库径流调节对水文情势的影响机理,为后续相关研究提供理论参考。
铃铛舞在彝语中被称为“恳合呗”,意为“战状舞”,在丧葬仪式的念指路经环节中,护送亡灵回归祖先灵魂栖居之处而跳的舞蹈。文章从贵州彝族铃铛舞的艺术特色出发,深入剖析其舞