基于基因网络的致病基因预测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bjjgx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
致病基因的研究是对遗传疾病的治疗具有重要的意义。近年来,高通量测序技术的高速发展为致病基因的研究带来了新的机遇,并涌向出大量的致病基因研究方法。这些方法基于已有的疾病或表型与基因之间的因果关系,使用网络构建方法对致病基因进行排序,从而达到致病基因筛选的目的。它们大多基于一个前提,即致使相同或相似疾病发病的基因在基因生物网络中邻近,存在着模块特性。但现有的方法对生物实体网络的邻接矩阵的构建较为粗糙,即存在关联关系的为1,否则为0,无法对基因之间的关联关系进行更合理的量化。此外,高通量测序技术产生了大量生物数据,使得集成数据分析方法成为目前致病基因研究的主要手段,但大多数方法都是基于生物实体的局部信息进行特征的构建,没有更好的扩展利用生物实体网络的拓扑特性。本课题研究的工作主要包括:第一,从另一种角度引入了研究生物实体间关系的方法,通过考察生物数据分布规律,来量化生物实体间的相对重要程度。基于此本课题引入两种统计特征量化数据间的关系。一种是计算基因表达数据的相关系数,用于分析基因间在功能上或者调控上对整个基因网络的重要程度;另一种是计算基因表达数据的信息散度,将基因的表达值作为基因表达的概率来量化基因间的表达分布,以此得到基因间的相互重要关系;与蛋白质交互网络数据的比对实验表明这两种统计特征的AUC、Top1和Top50在致病基因预测问题上优于后者,验证了所引入的两种统计特征对致病相关基因筛选的有效性。第二,提出一种随机游走算法的二元逻辑回归模型用于致病相关基因的预测。利用随机游走模型,对每一个基因进行关联基因的筛选,从得到与这个基因关联性强的基因中,分别从个数和权重这两个方面统计这些基因的全局信息,并用来构建基因的特征向量,得到了特征F1、特征F2和特征F3。第三,在特征F1下,三个不同的生物数据网络:蛋白质交互网络、基因共表达网络和基因通路网络中本章方法得到的AUC明显优于B Chen等人提出的特征“PCF1”、MRF算法和RWR算法得到的结果。在F2特征下,三个不同的生物数据网络中,本课题提出的算法的AUC结果高于B Chen等人提出的特征“PCF2”得到的结果。在特征F3下集成三种网络,本章提出的方法的AUC结果显著优于MRF算法、RWR算法、DIR算法和B Chen等人提出的特征“PCF3”的结果。此外还从时间效率上对这几种不同算法进行了比对,验证了本章算法更具有竞争力。
其他文献
目的探讨鱼腥草注射液静脉给药所致的不良反应的临床特点,为临床安全用药提供参考。方法对47例应用鱼腥草注射液致不良反应患者的临床资料进行分析。结果鱼腥草注射液不良反
<正>1引言由于中国传统体制和历史、政治、地理等环境因素影响,我国的物流企业大多数以国有大中型物资流通企业为前身发展而成,它们仅仅经过了短暂的现代物流企业转化过程,便
介绍一款采用 ARM 嵌入式系统设计的汉显数字汽车衡仪表 XK3190-DS2,结合 ARM 嵌入式设计要领分析该仪表的设计方案及功能特色。
<正>机关档案是机关履行职能活动的真实记录,是反映机关各项工作的原始凭据,是领导决策、工作查考和维护职工合法权益的重要依据,也是重要的信息资源和宝贵的经验财富。机关
我国已经认定的69个资源枯竭型城市中,以煤炭、石油、金属矿产为主的矿产资源型城市占绝大部分,这些矿产资源型城市对我国过去经济发展的贡献是不可替代的。过去易门县产业主要以铜矿的采选和粗加工为主,因此铜矿资源枯竭使易门县经济迅速下滑,经济、社会、环境问题也逐渐爆发,不得不进行转型。对易门县转型效果进行评价,不仅是对易门县11年来转型成果的检验,对于易门县当前转型存在的问题的也可以提出针对性的建议,促进
针对路感特性是线控转向技术的难点之一,设计与评价了轮式拖拉机线控液压转向系统的路感特性。分析了路感的评价指标、产生机理及拖拉机等农用车辆行车环境差异大的特殊性;实
为了缩短嵌入式车载导航系统开发进程,提高系统维护和升级能力,研究了Android平台的特点及车载导航系统的性能需求。建立以Android操作系统、GPS技术为核心的车载导航系统终
依据国内学者对实施"电脑派位+面谈"入学政策的支持观点与反对观点的分析,阐述了实施"电脑派位+面谈"入学政策的正当性。指出,在不允许通过考试方式选拔学生的情况下,唯有电
为解决中小企业等市场主体融资难的问题以及规范民间融资行为,国家先后出台了各项鼓励发展民间资本市场的政策。但由于近年来非法放贷活动日益猖獗并且往往诱发其他多种违法