蛋白质结构预测与核酸结合位点注释的智能算法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:gonggong1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构决定其功能,了解蛋白质的结构对蛋白质的靶向药物设计和功能注释有重大意义。然而,通过湿实验技术确定蛋白质结构成本高且耗时,而当前蛋白质结构预测算法的精度仍有待提高。核酸往往通过与其它分子(如蛋白质、金属离子等)的相互作用执行其生物学功能,准确识别核酸与其它分子的结合位点可以加速计算机辅助药物的设计。然而,现有的核酸与其它分子的结合位点预测算法的准确率相对较低。因此,本文针对这两个方面展开了以下研究:1.蛋白质结构预测。本文提出了一个快速准确的蛋白质结构预测算法tr Rosetta2,该算法是tr Rosetta的改进版,主要从两方面进行了改进。第一,应用了一种从多尺度提取特征的新网络Res2Net来提高残基间二维几何信息的预测,包括距离和角度。第二,将多个同源模板自动集成到网络中,以进一步提高预测精度,特别是对于容易或中等难度的目标蛋白。在CASP13和CASP14两个基准数据集上的实验结果表明,tr Rosetta2的接触预测精度分别比tr Rosetta提高了6%和8%。本文以tr Rosetta2的初始版本参加了CASP14双盲测试。实验结果表明,所提出的方法在91个目标上的预测结构模型的平均TM-score为0.67,tr Rosetta2将其提高到了0.69,与最佳服务器非常接近(Zhang-Server为0.71)。在CAMEO实验的161个目标蛋白上的进一步测试表明,tr Rosetta2到达了平均TM-score为0.8的水平,成功折叠了91.3%的蛋白质,优于CAMEO实验中表现最佳的参赛组。2.核酸结合位点注释。本文从两个方面对核酸结合位点注释展开具体研究,即蛋白质与核酸结合位点以及小分子与RNA结合位点预测,分别开发了对应的智能算法:(1)提出了一个预测蛋白质中与核酸结合的残基位点的新算法Nuc Bind。Nuc Bind是一个集成算法,结合了基于序列的算法SVMnuc和基于模板的算法COACH-D的预测结果。SVMnuc是一个基于支持向量机的算法,它使用三种互补的序列特征来预测蛋白质中与核酸结合的残基;COACH-D通过搜索同源模板来识别目标序列中与核酸作用的残基。本文在三个基准数据集上对所提出的方法与其它方法进行了评估和比较。实验结果表明,Nuc Bind一致优于现有的其它算法。尽管预测精度高,与其它大多数从头预测方法一样,SVMnuc与Nuc Bind存在两种核酸之间的交叉预测。Nuc Bind的成功归因于两点:一是SVMnuc中三种互补序列特征的使用,二是SVMnuc与COACH-D这两种互补方法的结合。(2)提出了一个预测小分子与RNA结合位点的新算法RNAsite。该算法基于序列谱和结构特征来识别RNA中与小分子发生作用的碱基,适用于RNA结构存在或者仅有序列可用的情况。在两个独立测试集上与RBind等其它三种算法的实验比较表明,当实验结构可用时,RNAsite与现有的表现最佳的RBind算法性能相当;当使用预测的结构模型时,RNAsite显著优于其它现有算法。本文讨论了通过检测小分子结合口袋对提高RNAsite算法准确度的可能性,还讨论了RNA结构的柔性以及与配体结合引起的RNA构象的改变对RNAsite算法的影响。RNAsite有望成为设计靶向RNA的小分子药物的有用工具。
其他文献
第一部分 实验性自身免疫性心肌炎动态lncRNA-gene表达库的构建目的:通过建立小鼠实验性自身免疫性心肌炎模型,利用lncRNA基因芯片技术构建实验性自身免疫性心肌炎lncRNA-gene表达库。方法:选取6-8周雄性BALB/c小鼠作为研究对象,通过免疫心肌肌球蛋白重链建立EAM模型,所有小鼠被随机分成4组:正常对照组(EAM第0天)、EAM第14天组、EAM第21天组和EAM第62天组。测
2005年,Omar M.Yaghi利用动态可逆共价键策略将分子结构单元扩展成网状排列的结晶的共价有机框架(Covalent Organic Frameworks,COFs)。在有机高分子材料领域,COFs具有许多非常突出的优势,如:长程有序性(高结晶性)、高比表面积、低密度、可功能化、丰富的单体选择等。尤其高有序性的特点,使COFs材料的结构可以清晰地确定,这样结构与性能的关系得以一一对应,进而
由于可以快速制造复杂金属零件,激光选区熔化(Selective Laser Melting,SLM)成形技术的应用前景十分广阔。然而,SLM成形过程中的高温度梯度诱导的零件高残余应力、变形甚至是开裂问题,严重地阻碍了该技术的工程应用。目前对于SLM成形过程中应力的分布和演化及其导致的变形还缺乏系统研究,特别是构成航空航天构件的典型结构的应力及变形研究还几乎是空白。本论文采用有限元数值模拟的方法,系
在过去的几十年中,金属-有机框架(metal-organic frameworks,MOFs)作为晶态材料,由于其独特而多样的多孔结构和功能性受到越来越多的关注。它们在气体存储和分离,非均相催化,传感器,药物输送等众多领域中展现了迷人的应用前景。MOFs组成单元中的金属节点和有机配体具有灵活的可调性和可修饰,因而可以设计和合成具有特殊结构和功能的MOFs材料。但是,目前仍然存在诸多的问题,阻碍了这
我国西北地区龙首山成矿带以世界级的金川铜镍硫化物金属矿床闻名于全球,也是我国西北地区一条重要的铀成矿带。该铀成矿带中发育多种类型铀矿床,包括成矿带西段的红石泉伟晶岩型铀矿床,成矿带中段的新水井、岌岭钠交代型铀矿床以及革命沟花岗岩外带型铀矿床,成矿带东段的金边寺淋积型铀矿床。其中新水井和岌岭铀矿床是我国少有的钠交代型铀矿床,也是我国西北地区碱交代型铀矿床的典型代表。对岌岭钠交代型铀矿床开展系统的研究
近三十年以来,二维材料因其奇异的电子性质,光学性质和磁性质等受到广泛关注。随着理论预测和实验合成,新型二维原子晶体材料不断被发现。这些二维材料不仅揭示了深刻的物理机制,而且在下一代信息技术等方面展现潜在的应用前景。比如,单层MoS2薄膜能够实现“开”和“关”的调控,有望应用于场效应晶体管;钛酸锶表面的单层FeSe薄膜具有高温超导特性;单层CrI3薄膜存在长程铁磁序等。这些新奇现象的发现,对进一步理
铁电材料具有可翻转的电极化性质,能用于非易失性存储器、电容器、传感器和执行器等多个领域。多铁材料将多个基本铁序集中到一个材料中,不仅同时具有铁电性、磁性等性质,还能互相耦合,有望实现新器件的新颖应用。传统的铁电或多铁材料主要是钙钛矿块体材料,比如典型的铁电材料Ba Ti O3,多铁材料Bi Fe O3,这些材料普遍带隙较大、迁移率低;而且它们的薄膜材料存在临界厚度效应,在应用于微型化和集成度越来越
混沌在经典动力学中指具有确定性但不可预测的现象,以受经典运动方程支配的轨道长期性行为为特点。在量子力学领域,由于微分方程关于时间为线性,且由于不确定性原理的影响,轨道没有得到良好的定义,不存在严格的混沌现象。量子混沌研究的是经典系统中的动力学行为在所对应量子系统中会有怎样的特征。其中著名的结论有Bohigas-Gianonni-Schmit猜想和Berry-Tabor猜想。它们表明对应于经典动力学
本文主要研究了图的彩虹不连通染色问题。令G是一个非平凡的边染色连通图。一个边割被称作彩虹边割,如果边割中的任意两条边都染不同的颜色。若图G中的任何两个顶点之间都存在一个彩虹边割分离它们,则我们称图G是彩虹不连通的。若图G的一个边染色使得图G是彩虹不连通的,则称这个染色为图G的彩虹不连通染色。对一个非平凡的连通图G,使得图G是彩虹不连通的所需的最少颜色数被称为图G的彩虹不连通数,记作rd(G)。我们
Sylvester建立了高斯系数与二元型的半不变量之间的联系,从而证明了Cayley提出的关于高斯系数单峰性的猜想。Pak和Panova利用对称群表示理论中Kronecker系数的半群性质证明了高斯系数的强单峰性。Reiner和Stanton引入了高斯系数的对称差(?),并利用李代数的表示理论证明了Fn,k(q)在满足k≥2且n为偶数时是对称的单峰多项式。在本论文中,我们引入了杨图的半图这一组合概