蛋白质局部结构—局部序列统计势的构建以及RNA结合位点的预测

来源 :中国科学技术大学 | 被引量 : 1次 | 上传用户:z30405060
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在本文中,我们设计了一个普适的统计势函数来评价蛋白质局部结构和局部序列之间的相关性。首先我们对天然蛋白中所有的五个残基长度的片段进行分簇。这个分簇是基于残基片段的构象(局部结构字母类型),二级结构类型及溶剂可接近性来进行的。然后对于每一个簇,可以统计得到其天然的氨基酸概率分布。根据这个氨基酸概率分布,我们可以得到给定结构下其序列的统计势。这个氨基酸概率分布,也可以通过使用数据集片段逐个匹配的方法来得到给定序列下其结构的统计势。同前人的局部统计势函数模型不同的是,我们整合考虑了局部环境,而且使用的是片段作为结构单元而不是单个的残基,这样做的好处是不仅可以包含相邻残基的关联性,还可以包含相邻(重叠)片段之间构象的强相关性。我们主要进行了片段threading,赝序列设计,局部结构预测等测试。在这些测试中,我们的统计势相对与现有的其他统计势函数得到了相似甚至更好的性能。这也证明了整合考虑环境因素来获得统计势的优越性,同时也说明这个统计势在序列设计和结构预测等方面是具有广阔的应用前景的。RNA结合蛋白(RNA-binding proteins(RBPs),)同RNA的结合在调节细胞的基本功能中起着重要作用。有一些计算方法通过使用一些序列或者结构-生成的特征来预测RNA结合位点。为了得到更高的预测性能,需要对现今的预测方法有进一步的提高。我们也发现RNA结合位点和非RNA结合的结构邻居的氨基酸组成足不一样的。结合这个结构生成的特征以及进化和其他结构信息后发展的预测RNA结合位点方法,同其他现有的方法相比较,可以显著的提高预测的准确度。我们使用的是多线性回归方法,6-重交叉验证,我们得到的MLR模型最好能达到87.8%的正确率,马修斯相关系数MCC为0.47,特异性为93.4%,能正确的预测出107条RNA结合蛋白链中的52.4%的RNA结合位点。同现有的方法进行比较,我们发现使用了结构邻居的氨基酸组成以后,明显的提高了预测的精度。
其他文献
降雨是对流层中最常见的气象要素之一,它不仅与人类的生活、生产息息相关,而且降雨体系在整个大气的能量传输中起着很重要的作用,它在相当程度上引起了全球热量和湿度的重新分布。因此很早就受到了人们的关注和研究。对它的了解将推动大气海洋耦合的研究,帮助我们理解潜热在大尺度环流中的作用,提高我们对暴雨系统的动力学及形态学等许多方面的理解。目前,机载、星载雷达被越来越广泛的用于降雨的观测,它们有许多相似之处,如
学位
本论文主要介绍了稀有气体和双原子分子(CO,NO)团簇的同步辐射真空紫外光电离实验和理论研究,还介绍了原子分子物理实验站稀有气体滤波器的安装和调试工作,以及乙苯的光电离实验和理论研究。第一章介绍了原子、分子和团簇的光谱学和动力学研究现状,比较详细地介绍了光电离和光离解研究中的基本概念,如绝热电离能、垂直电离能、光电离截面、超激发态、里德堡态,以及基本的离解机理。介绍了光与物质相互作用研究中常用的实
粒子物理标准模型能够很成功的描述很多物理实验结果。它成功的预测了粲夸克(c),底夸克(t),Z玻色子,W玻色子以及希格斯玻色子的发现。量子色动力学(QCD)能够描述标准模型中夸克和胶子之间的强相互作用。基于格点量子色动力学的计算,在高温和低重子密度条件下,会发生从强子物质到夸克解禁闭的夸克胶子等离子体(QGP)的相变。夸克胶子等离子体也被认为存在于宇宙早期的演化中。美国布鲁克海文国家实验室(BNL
本论文的内容主要包括两个方面,一个是NSRL(National SynchrotronRadiation Laboratory)光电子能谱光束线和实验站的建设,一个是对Cu/3C-SiC界面的研究。NSRL原有的光电子能谱光束线自建成以后,在同步辐射应用研究方面发挥了重要的作用,并取得了很多有意义的结果。但是由于种种原因,这条光束线存在很多问题,使光电子能谱实验站不能充分发挥同步辐射的优势,因此决
《芙蓉楼送辛渐》是部编本四年级语文下册第七单元的内容,本单元以人物品质为主题。本课是开展"空中课堂"期间准备的一节常规课,面向武汉经济技术开发区(汉南区)全体四年级学生。一、激趣导入,唤起学生情感体验1.(出示PPT)今天我们进入第七单元的学习,本单元以"人物品质"为主题,在阅读中我们要从人物的语言、动作等描写中感受人物的品质,在习作中,则要学习从多个方面写出人物的特点。
期刊
由于在超高密度磁存储技术、磁阻传感器、磁随机存储器等诸多方面有着广泛的应用前景,微米、纳米磁性单元阵列最近吸引了越来越多的兴趣。目前,磁性单元研究包括微米、亚微米以及纳米尺度的磁性单元的制作及其特殊的磁特性研究。这些微小的单元的磁特性与大块材料以及连续膜的磁性有着诸多的不同之处。各向异性、单元之间的相互作用以及不同状态的磁畴结构是其中的几个最重要的问题,它们对于磁滞回线、矫顽力、剩磁、饱和场都有影
量子计算研究的根本目标是建造基于量子力学原理,能在许多复杂计算问题上大大超越经典计算机性能的新型计算机。作为经典计算方式的继承,量子计算能有效处理一类计算问题,这些问题在经典计算科学中具有相当计算复杂度甚至无法完成,比如大数的质因数分解。量子计算机的实验实现需要对脆弱的量子体系进行初始化,相干控制和操作以及读。要建立一种能够满足各方面要求的量子计算机是非常困难的。相比较而言,核磁共振是当前技术上最
蛋白质最重要的两类生物大分子之一,是生物体几乎所有活动的承担者,如生化反应的催化酶,呼吸系统中的血红蛋白,免疫系统中的抗体等等。生物体几乎所有的活动都离不开蛋白质。要想在分子水平上解释生命现象离不开对蛋白质结构和功能的研究。多数天然蛋白质在生理条件下都会折叠成稳定的三维空间结构,蛋白质的生物学功能在很大程度上取决于其空间结构,蛋白质结构构象多样性导致了不同的生物学功能。所以蛋白质结构的研究是功能研
本论文的工作重点包括:人类MAPKs家族激酶MEKK3的N端PB1结构域的克隆,表达,纯化并用核磁共振的方法解析了溶液中MEKK3 PB1结构域的结构。在结构解析的过程中,我们发现了MEKK3 PB1中存在着有趣的脯氨酸顺反异构现象。基于结构,我们研究了MEKK3 PB1与其下游激酶MEK5的N端PB1结构域的相互作用。我们的另一项工作是解析了人类Mog1蛋白的溶液结构;并初步研究了其与核转运蛋白
学位
阿克苏地区核桃栽培面积达16.25万公顷,总产量53.5万吨,良种使用率达80%以上,核桃是阿克苏地区第一大林果树种,是农民收益的主要来源,但部分核桃园存在管理不善、投入不足等问题,导致果园产量低、果品品质差。本文分析早实核桃低产原因,对产量低、品质差、结果晚、甚至不结果的低产树、实生树、郁闭园、树形紊乱的低产园进行品种改接、疏密,通过加强土肥水管理、病虫害防治、树形改造等技术措施,达到丰产优质、