基于网络结构推理和拓扑相似性的致病基因预测算法

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zhuhande
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现阶段,研究者们发现几乎所有的疾病都与基因有一定的关联,如何迅速地找到疾病的致病基因对所有研究者们来说是一项很大的挑战。早期,研究者大多使用传统生物实验的方法来进行致病基因的预测,比如连锁分析和关联研究。近几年来,研究者们开始大量使用生物信息学中的计算方法,并通过基于网络结构方法来解决该难题。然而,大多数方法在推理过程中仅仅使用了网络结构中的局部网络信息,并且仅限于推理单一基因的关联。此外,这些方法很少或几乎没有考虑到疾病与基因关联网络中的网络拓扑相似性。本文结合生物信息学和数据挖掘领域中的相关知识,使用了 OMIM(Online MendelianInheritance inMan,OMIM)数据库中的203个疾病数据作为实验的数据集来进行致病基因的预测。本文主要的研究内容和创新工作概述如下:1.为了预测致病基因,本文首次引入二部图网络结构推理(Network-Based Inference,NBI)算法。具体的步骤如下:首先,构建疾病和基因的关联二部图网络;其次,利用物质热扩散原理将基因上的初始化资源扩散到疾病上;最后,再将疾病上的资源扩散到基因上。上述操作结束后将会获取到候选基因的资源向量,并对资源向量按值大小排序进而预测潜在致病基因。在使用OMIM数据集中的203个疾病数据作为最终的实验数据,通过留一交叉验证实验来证明该算法的有效性。2.针对二部图网络结构推理的算法,提出了一种基于网络拓扑相似性的改进算法,称为 INBI(Improved Network-Based Inference,INBI)算法。首先,分别计算网络拓扑相似性,本文通过使用高斯核函数来计算基因网络的拓扑性和疾病网络的拓扑相似性;其次,分别构建疾病邻接矩阵和基因邻接矩阵;然后,预测致病基因的相关性分数;最后,根据相关性分数进行排序从而预测潜在的致病基因。在进行对比实验结果的分析后,可以得出INBI算法具有优越的性能。
其他文献
随着科技进步,移动通信系统进入高速发展时期,其中,GSM(Global Systemfor Mobile Communications)通信网络已经遍布世界各地。在我国,绝大部分地区都实现了GSM网络覆盖,并拥有全球
近年来,中继协作通信技术正在以飞跃的速度发展,它能够有效地降低因无线信道衰落对信号带来的影响,一直以来受到了人们的广泛关注。在无线中继网络中,需要对源节点和中继节点
多输入多输出(MIMO)技术从诞生开始,就因其可以增加空间自由度,提升移动通信系统的性能增益而备受关注。然而,随着智能终端及其应用的快速发展,海量的联网终端所产生的巨大数
随着科学技术的蓬勃发展,越来越多功能强大的图像编辑软件在我们生活中普及开来,这样导致数字图像越来越容易被人为编辑和篡改,并且不留任何明显的痕迹就可达到视觉上的逼真
为满足未来移动通信系统对更高数据传输速率的需求,3GPP的长期演进项目(LTE)及其进一步演进LTE-Advanced改进并增强了3G的空中接口技术,在下行链路引入正交频分复用(OFDM)和多
随着校园网络建设的不断发展,许多高校的校园网络都已经具有了一定的规模,基于网络的教学与办公等应用的广泛开展,使得用户对网络的依赖性越来越强。日益增长的网络用户和接
图像去噪是信号处理中的一个经典问题。图像在数字化和传输过程中常受到成像设备与外部环境噪声干扰等影响,成为含噪图像。这些噪声使图像质量变差,影响人们对图像的理解,而
随着城市道路交通管控的需要,道路交通信息的相对匮乏正促使着交通信息全面感知技术的快速发展。在自由流状态下,对当前某一特定车辆的精准识别是交通感知领域的一个重大研究课
低功耗广域网(LPWAN: Low Power Wide Area Network),是专门为实现低功耗、远距离、低速率、大连接的物联网应用而设计。电气和电子工程师协会IEEE(Institute of Electrical a