蛋白质相互作用网络中模块识别算法的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:fctznh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着预测蛋白质相互作用技术的提高,产生了大量的数据,这些数据一般被表示为复杂网络的形式,因此迫切需要引入高效的计算的方式来对这些数据进行分析。研究表明,蛋白质不是以单体的形式进行工作,而通常以模块结构来发挥它的功能。辨识蛋白质相互作用网络中的模块结构对理解生物系统的结构和功能有着十分重要的意义。以往的识别模块的算法主要是从网络中检测出高密度的子图,但是忽略了蛋白质模块本身的组织结构,在识别的精度和效率上都有待提高。   因此,本论文的主要工作如下:   1.基于核心附件模型实现了一种具有较高精度的贪心模块识别算法。本文基于核心附件模型,提出了一种新的边的权重计算方法,利用贪心搜索算法首先从网络中挖掘内部存在较多相互作用的稠密子图作为核心,然后为核心挑选高相关性的附件蛋白质,从而形成功能模块。实验结果的分析表明,所得到的模块中的蛋白质在功能上和生物过程上有着密切的关系,绝大多数的模块都表现出非常显著的GO相关性,并且很多的模块与一些已知的蛋白质复合体相匹配,同时,可以找出重叠的模块。   2.把贪心思想和层次聚类相结合提出了一种快速聚类算法。目前的方法在进行层次聚类的过程中需要重复计算边的权重,因此效率不高,而且不能很好的指出所形成的层次结构中的哪些分支是模块,针对这些问题,论文提出了一种快速聚类算法,该算法把贪心的思想和层次聚类的方法相结合,对网络进行快速合适的划分。该算法在避免重复计算的前提下能快速地从网络中识别出蛋白质的模块结构,并且识别出的模块具有不错的精度。
其他文献
交通对于经济发展、生活水平提高有着非常重要的作用。智能交通系统(ITS)代表了现代化交通运输的发展方向,是一种实时、高效、全方位的综合交通运输管理系统。要构建完整的IT
近年来,恶性肿瘤(癌症)的发病率和死亡率均呈上升趋势,已成为严重威胁人类生命健康的主要疾病,早发现、早诊断、早治疗仍然是目前肿瘤临床工作的重点和难点。在肿瘤的生长过程中
图像并行处理是一种综合的数字信息处理技术,它主要是以并行计算环境和并行算法为基础借助现在拥有的设备和算法以低廉的价格实现高性能的计算,它是大数据量数字图像在计算机
随着计算机技术的高速发展,计算机虚拟技术在电子测量仪器上的应用越来越重要。传统示波器的灵敏度低、可扩展性差,不适合测量技术发展需求。虚拟仪器技术的产生和发展解决了
随着计算机技术的发展以及互联网应用的兴起,如何有效地管理与检索图像已成为目前信息检索领域中的重要课题。由于传统的基于内容的图像检索方式无法解决“语义鸿沟”(低层的
经过多年的研究,人工神经网络的研究已经取得了丰硕的成果。然而传统神经网络(BP、RBF)的权值是常数,训练的权值难以反映样本的信息,而且传统神经网络的模型难以确定,隐层神
数据挖掘是从大量数据中发现有用知识的一种手段,已成为目前国际上数据库和信息决策领域最前沿的研究方向之一,受到了学术界和工业界的广泛关注。但随着数据量越来越大和数据
当今世界反恐形势严峻,为保证社会安全,对可疑遗留物件的检测已成为机场、体育馆、候车厅、展览馆等公众场合安防系统不可缺少的内容。随着视频检测技术的发展,图像分割、背
电阻层析成像(Electrical Resistance Tomography,ERT)是一种基于电导率敏感机理的过程层析成像技术,以其非辐射、非侵入、响应速度快、结构简单、成本低、适用范围广、安全
图像匹配是图像处理与机器视觉的基本问题之一,在医学图像分析、遥感图像处理以及电子稳像等应用领域引起广泛的关注。本文在向量场一致性(Vector Field Consensus,VFC)算法