基于协同过滤的疾病基因预测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yeshen_001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遗传疾病的致病基因预测问题一直是人类健康领域面临的重大挑战之一。随着人类基因组计划的顺利完成,各种生物数据得到快速增长,采用计算的方法从这些数据中挖掘基因与疾病之间关系的研究得到越来越多的关注。当前大部分基于计算的疾病基因预测方法采用疾病基因的模块性假设,即导致相同或相似疾病的基因在蛋白质相互作用网络中拓扑位置相互靠近。基于这一假设提出的随机游走预测方法利用蛋白质相互作用网络的全局拓扑特性来计算基因之间的相似性,然后对候选基因打分并排名。与利用局部拓扑特性的计算方法相比,随机游走方法有较好的预测效果,但是基于疾病基因模块性假设的方法仅仅从蛋白质相互作用网络的拓扑角度来计算基因之间的相似性,并没有利用其他的生物网络,比如疾病表型相似性网络。基于协同过滤方法,本文集成三种生物网络来预测疾病的致病基因,即蛋白质相互作用网络、疾病-基因关系网络和疾病表型相似性网络。首先根据疾病基因的功能相似性假设计算基因之间的相似性;其次运用协同过滤方法计算疾病和候选基因之间的关系;最后把计算出的疾病-基因关系作为先验知识,根据疾病基因的模块性假设,采用随机游走方法对所有候选基因进行打分并排序,选取排名靠前的基因作为预测结果。本文方法既利用了疾病基因的模块性假设和功能相似性假设,又集成了疾病表型相似性网络数据。留一交叉验证结果表明本文方法的ROC曲线优于随机游走方法和PRINCE方法,文献挖掘结果表明本文方法的预测结果准确度较高。
其他文献
随着网格技术的发展和应用范围的扩大,不同的资源特性和独立的安全策略使得网格的安全方案异常复杂。如何安全的共享分布于不同领域不同平台的网格资源,成为网格安全面临的主
数字水印技术是近几年提出的一种产品版权保护技术。人们为了保护数字产品不被非法侵权,将版权标志、用户序列号或与产品相关的信息作为水印信息,嵌入到数字产品中,以进行产品版
本文对民族地区高校网络教学设计与评价进行了研究。文章从建构主义学习理论入手,通过对传统教学模式与网络教学模式的比较,总结出网络教学模式所具有的开放性、自主性、协作性
近年来,通信市场的竞争由单一的价格战演变为形式多样的资费套餐业务的竞争。各大运营商纷纷推出各种资费套餐业务吸引用户。要想在竞争中取得有利的地位,套餐策略必须紧跟用户
学位
在竞争日益激烈的电信行业,高效利用各个独立、分布的业务系统在长期生产经营活动中积累沉淀下来的数据,是电信运营商正确制定营销策略,取得竞争优势的重要保证。然而,运营商独立
网络搜索的研究是当前计算机科学领域研究的热点与前沿,研究重点逐渐从原始的关键字搜索趋向于更加智能更加复杂的高级搜索,如实体搜索领域。在实体搜索中,输入为一个关键字或语
随着视频会议、VOD、大规模网络游戏以及文件共享等网络应用的广泛普及,Internet中引入了Multicast(组播)技术。目前的组播技术主要分为两种:IP组播、应用层组播。IP组播技术无
蚂蚁算法在求解二次分配问题(QAP)问题上已经取得了较好的结果,目前的研究集中在如何提高算法的性能上。提高算法的性能需要解决的重要问题是平衡两种趋势:纵向探测和横向搜
随着信息技术的发展和图像压缩标准的普及,在压缩域上进行基于内容的图像检索成为当前信息领域的研究热点。分形以迭代函数系统来表征图像特征,在图像压缩方面效果良好,同时