基于Markov逻辑网的蛋白质关联预测研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:m116730647
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质三级结构预测是生物信息学上的一大挑战,至今为止还没有好的方法能够获得期望的预测效果。利用从头预测方法对蛋白质三级结构进行预测的过程中,如果能够获取到蛋白质关联的信息,可以在很大程度上提高预测的精度,因此精确的蛋白质关联预测在三级结构预测中起着非常重要的作用。在同一个蛋白质中,蛋白质残基之间的关联并不是相互独立的,而对于传统的机器学习方法,它们要求样本实例相互独立并符合一致性分布,所以这一类方法不能很好的解决蛋白质关联预测问题。于此同时,蛋白质关联往往受很强的规则的约束,很多的规则都是先验的。基于以上情况,本文提出来一种基于统计关系学习框架的方法——Markov逻辑网对蛋白质关联进行预测,该方法能够克服传统机器学习对独立一致性的要求,并能够很好的利用蛋白质关联中的约束规则,通过利用基于权值的逻辑语言规则来表达蛋白质关联的领域知识,使问题得到很好的解决。本文的主要研究工作如下:①对蛋白质关联预测进行了全面综述。介绍了蛋白质关联预测产生背景,研究现状和研究意义,并重点分析了蛋白质关联图中包含的蛋白质三级结构信息。②对统计关系学习和Markov逻辑网相关理论进行了全面的综述。介绍了Markov逻辑网的概念与特性,并针对Markov逻辑网的学习和推理算法进行相关的讨论。③对蛋白质关联预测中使用的数据进行介绍,对预测中所使用的蛋白质特征信息进行具体的分析,以此来达到提高关联预测精度的目的。④从蛋白质的空间物理结构以及生化特性上对蛋白质关联规则进行了具体而深入的研究,抽取出蛋白质关联的一系列规则,对每一条关联规则进行了具体的阐述,并构造出其在Markov逻辑网中对应的谓词公式。⑤将Markov逻辑网应用到蛋白质的关联预测中,研究并实现了利用该方法对蛋白质关联的预测,并对实验进行了具体的分析。实验结果表明,基于Markov逻辑网的蛋白质关联预测能够取得相对于其他预测方法更好的效果,与当前预测效果最好之一的BetaPro预测比较,预测提高的精度比较显著,最好能提高八个百分点,这也进一步验证了Markov逻辑网这一统计关系模型的应用价值。
其他文献
随着科技的不断发展,领域文献和术语词典不断累积,将非结构化的领域文献转变为结构化的知识库日益成为知识工程的研究重点。然而,现阶段特定领域知识库构建往往缺乏相应的信
在过去的几十年,神经网络的动力学分析因其重要的理论和实际意义,受到了各领域学者和专家的广泛关注。神经网络有着广泛的应用背景,与计算机、数字网络、嵌入式系统、以及人工智
近年来,随着信息技术的快速发展并逐渐运用于军事领域,计算机信息化管理对征兵工作起到了极大的推动作用。现行的以单纯的计算机管理和传统的手工管理相结合的工作模式,已经很难
识读视频中的数字时钟是一个重要的应用问题,在智能监控、娱乐等领域有着重要的应用价值。文献中已有算法可以很好地识读视频中的数字时钟,但是这样的算法还存在两方面的问题
随着二维条码技术的不断发展以及智能手机性能的不断提高,手机二维码已经在在各个行业中得到了广泛的推广,给人们的生活带来了极大的便利。随着移动网络增值业务的不断发展,其应
随着互联网及其应用的快速发展,互联网上的数据量急剧增长,网页上的数据已经成为一个巨大的数据库,其中包含着大量潜在的有用信息,如何从中抽取出用户感兴趣的数据已经成为人们关
随着生物技术的发展,生物实验生产了海量数据,为了对这些数据进行处理,从系统层次理解生物系统的“系统生物学”被生物学家们提出并得到了迅速发展。在疾病研究领域,疾病的发生发
随着互联网的发展、互联网用户的增加,互联网中的数据也急剧膨胀。而为了满足广大用户的需求,互联网企业需要去保存、挖掘这些数据。如此海量的数据也极大的增加了各大互联网
随着网络技术的不断发展和网络应用的持续推广,人们的生产和生活越来越依赖于计算机网络。然而网络却十分脆弱,经常会遭受部分人有意或者无意的破坏,导致网络安全问题层出不穷。
基于属性的密码体制是近几年来公钥密码学研究的新热点。在基于属性的密码体制中,通过一个属性集合来描述用户身份,简化了传统公钥密码中公钥管理和密钥托管问题,减轻了系统