蛋白质相互作用网络中关键蛋白质识别算法

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:slylzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是组成人体一切细胞、组织的重要成分。根据蛋白质对于生物体自身活性的重要性存在差异,可将蛋白质划分为关键和非关键两类。关键蛋白质是生物体生存和繁殖所必须的蛋白质,研究关键蛋白质有助于我们熟悉细胞存活的基本要求,并且可以为疾病治疗找到新方法。近几年,高通量技术的发展使得生物信息数据逐渐完善,蛋白质相互作用网络(Protein-protein interaction network,PPIN)数据日渐丰富。利用这些数据,研究者们提出了许多关键蛋白质识别算法。然而,PPIN数据中仍存在较高比例的假阳性和假阴性“噪声”数据。再者,现在已经有很多基因组学和蛋白质组学的数据信息。融合多个数据源可以弥补单一数据源不能全面刻画蛋白质相互作用的缺点,使各个数据源之间可以相互补充、相互印证。如何融合多源数据,提高识别关键蛋白质的准确率仍值得深入研究。针对本问题,本文在蛋白质相互作用网络的基础上,融合多元生物信息来识别关键蛋白质,主要工作如下:(1)提出了一种基于网络拓扑与多种生物信息融合的关键蛋白质识别算法。该方法首先将网络拓扑特性与亚细胞定位信息和蛋白质复合物信息结合分别提出SNC(Subcell-node Centrality)和SIDC(Subcellular-In-Degree With Complexes)两种算法,分别针对网络中两种类型的蛋白质,一种命名为三角形结构,另外一种为星型结构,并通过计算这两种类型蛋白质在网络中的占比分别赋予SNC和SIDC对应的权值。考虑到蛋白质的关键性仅仅依赖蛋白质之间相互作用的拓扑特性是远远不够的,因此将蛋白质复合物信息,亚细胞定位信息与拓扑特性结合提出最终的关键蛋白质识别算法CTB(Combination topology-bioinformation),实验结果表明该方法显著提高了关键蛋白质的识别准确率。(2)设计了一种多属性决策方案的关键蛋白质识别算法。传统的关键蛋白质的识别算法大多只关注网络中蛋白质的某一特性,存在信息丢失问题。另外,蛋白质关键性的研究由于出发点的不同而导致得出的蛋白质关键性排序序列千差万别,如在经典的中心性方法中,从网络局部结构出发的算法(如度中心性)仅仅关注网络中蛋白质的局部属性,找出的关键蛋白质都是在网络的某个局部范围中关键性最强的蛋白质集合;从网络全局结构出发的算法(如介数中心性、紧密中心性)基于网络的全局拓扑特征评估了蛋白质关键性,虽然提高了算法的精度但是所需耗费的计算时间呈几何倍数增长,不利于在较大规模的网络中应用。基于这一思想,本文从不同角度出发提出了GDC(Gene-Degree Centrality)、SNDC(Subcellular-Neighbor-Degree With Complexes)以及SIDC(Subcellular-In-Degree With Complexes)三种判别关键性的标准,与BC都作为多属性决策方案的属性。利用AHP(Analytic Hierarchy Process)加权后的TOPSIS(Technique for order performance by similarity to ideal solution)算法求解蛋白质关键性得分。经过多种评估方案分析,本文提出的EPI-TOPSIS算法提升了关键蛋白质的识别精度。(3)设计了一种有偏向重启随机游走的关键蛋白质识别算法。重启随机游走作为一种优化算法,是一种有效地网络特征信息提取方法。本文将其应用在关键蛋白质识别上,在游走过程到达稳态时,可以获得整个蛋白质相互作用网络中的每个蛋白质的信息。但是传统重启随机游走过程中,粒子在网络节点中向下一个邻居节点游走时是等概率的,忽略了不同邻居与当前节点的关系。尤其是蛋白质相互作用网络,每个蛋白质携带复杂地生物信息,并且两个相互作用的蛋白质间的功能具有相似性。因此本文利用基因表达相似性和亚细胞分布相似性重新定义转移概率矩阵,使得粒子在游走过程中更倾向于功能相似的蛋白质,即随机游走带有偏向性,从而更好地挖掘每个蛋白质的特征信息。另外,带重启的随机游走可以避免粒子在游走过程中未到达稳态时进入死角而发生终止。本文利用GO语义相似性和亚细胞定位信息构建重启概率向量来解决这一问题。最终通过有偏向的重启随机游走模型提出BRWR算法来识别关键蛋白质,当BRWR过程达到预设的稳定状态时,可以获得每个蛋白质的关键性分值,排序后可以得到候选关键蛋白质集合。实验证明该算法提升了关键蛋白质识别的准确率。
其他文献
期刊
农业生产对水资源需求量极大,为加快建设资源节约型、环境友好型社会,农业生产应积极探索更有效的节水方案,做好灌溉用水控制,提高水资源利用率。以甘肃省张掖市临泽县为例,分析临泽县农田水利工程高效节水灌溉技术应用中存在的问题,提出根据区域实际情况进行统筹规划、建立农田灌溉用水自主管理机制、加强高效节水灌溉技术研究和应用、控制水资源价格及加大资金投入力度等改善策略。
期刊
绝经后骨质疏松症(PMOP)作为中老年女性原发性骨质疏松症最常见的类型,其导致的骨含量下降、骨痛、骨骼变形甚至病理性骨折等并发症严重危害身体健康,已成为影响现代中老年女性健康的一个重大公共卫生问题。鉴于常规西医治疗疗效有限且存在一定的副作用,本文综述了近年中医药治疗PMOP的相关研究,为临床实践及现代中医理论的完善提供一定的参考。
微生物抗菌肽具有抗菌谱广、不容易引起细菌耐药性、易实现量产等优点,是目前较有希望替代传统抗生素的一类抗菌物质。然而,微生物抗菌肽在生物医药中的广泛应用受限于其稳定性低、功能单一、细胞毒性高等问题。结冷胶是一种水溶性和结构稳定性相对均衡、生物相容性优良的微生物多糖,在食品中已有广泛应用但在生物材料中的应用非常有限。将结冷胶与微生物抗菌肽结合可有效改善微生物抗菌肽自身存在的缺陷,本论文以三种典型微生物
<正>目前,数字经济对经济社会的引领带动作用愈益凸显,对此,农工党襄阳市委会围绕“做强做优襄阳数字经济,助推全省数字经济发展”开展了专题调研。一、襄阳市数字经济发展现状(一)数字新基建稳基础一是快速推进5G网络建设与应用示范。
期刊
介绍了电气控制系统故障的表现形式,包括控制板故障、变频器故障、继电器故障、安全回路故障、门锁回路故障和电磁干扰故障,提出了电梯电气控制系统故障维护方案。分析认为,工作人员虽然可以凭借自身经验分析故障原因,开展维护工作,但是为保证工作质量,应针对实际情况进行具体分析,以保证问题解决质量。
根据核心素养的要求反思初中英语教学,发现存在诸多问题。教师可以依托项目式学习,遵循项目活动的主题性、整体性和实际应用性三大原则,从学习目的和学习内容入手,围绕项目主题开展项目活动,完成学习任务,促使学生从中获取语言知识,发展语言能力,提升思维品质,提高解决实际问题的能力,落实英语学科核心素养的培养。
环境精细化治理具有“横向到边、纵向到底”的无缝隙治理优势、“动态感知、即时响应”的敏捷治理优势和“资源占用少、治理成本低”的简约治理优势。然而,受体制惯性、利益博弈和技术障碍等多重因素的制约,中国城市环境精细化治理的固有功能及其成效并未得到充分发挥。尽管中国环境精细化治理的外部环境、内部条件与新加坡有所不同,但二者之间在基础层面上仍存在较大的共通性与相似性。考察新加坡的精细化治理实践可以发现,新加
校园文化建设同高校思政教育之间存在着一定的共通性,对加强新时期大学生思想教育具有重要的意义,但在当前,其发展建设仍存在一系列问题,严重影响着德育功效。基于此,以校园文化建设与思政教育协同育人的实践路径为研究内容,深入分析高校校园文化与思政教育的内涵与育人功效,并从优化顶层设计、丰富内容供给、加强物质保障、加强师资建设等方面提出了相应的解决策略。
期刊