系统水平整合分子数据及表型数据重构罕见疾病分类体系

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:LuYang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物医学数据采集技术的进步,组学科学产生了越来越多的生物医学数据,可获得的生物实体(如基因、表型、疾病等)关系数据不断积累。Orphanet是目前相对完善的基于疾病的临床症状和体征观察而建立的。然而,它没有考虑基因组学等组学数据对疾病关系的影响。以前的研究表明,疾病的遗传学知识可以决定疾病分类,并且是预测疾病之间关系的最重要的因素,同时,研究疾病关系正从基于共享基因等单个实体向系统的整合多个分子水平的数据转变。在此,本文针对罕见疾病异构信息网络数据,利用图正则化的非负矩阵三分解(GNMTF)模型,它将所有网络数据以矩阵形式表示,同时对罕见疾病,表型,基因进行共聚类,从而推断新的罕见疾病关系,从结果来看,通过整合基因相互作用组,罕见疾病-表型关系,罕见疾病-基因关系,我们的方法得到的罕见疾病关系对与Orphanet中直接相连疾病关系对重合率达到91%。然后我们运用边聚类算法探究新得到的罕见疾病拓扑网络中的疾病模块,并生成罕见疾病分类树状图。相比较于Orphanet,新得到的疾病模块中,疾病间分子层面相似度更高。此外,我们评估本文所包含的11种关系类型对预测模型性能影响,结果进一步强调了系统整合疾病分子学数据的重要性。最后,运用矩阵填充来预测基因-疾病关系,并发现本文采用的方法在致病基因排序上的准确率明显优于之前的两种方法。
其他文献
财务报表是企业内部与外部进行信息交流的主要工具,掌握一定的财务分析方法对于投资者而言,就显得格外的重要。文章主要从长城汽车2014年以及2015年的财务报表出发,阐述一下
磁流体力学(Magnetohydrodynamics(MHD))是结合流体力学和电动力学的方法研究导电流体和电磁场相互作用的学科。在本文中,我们利用古典能量方法、Galerkin方法、不动点定理、
棉花产业对于国家社会经济建设有着重要的影响,通过不断的探寻棉花纤维检验技术,来实现棉花纤维检验实验技术在整个棉花种植过程中的适用,从而推进棉花产业总产值的稳步增高。棉
C#下的计算机在线打字测试系统作为一个标准化的考试系统,该系统应用的关键是,掌握计算机语言在程序编写过程中需要注意的地方以及程序的正确调试方法,设计计算机在线打字测
社交定向是指个体在社交情境中察觉和注视社会刺激的行为倾向,是社会性注意的内容之一,对自闭症儿童发现社会刺激,促进社会性发展起着重要作用。自闭症儿童对社交活动、肢体
再进入二十一世纪以来,我国的企业在发展的过程中,面临的挑战日益增多。如何在这个竞争日益激烈的市场中生存下去,一直以来都是企业发展的核心问题。企业的财务报表分析工作
本文主要论述在焦化蜡油的加工过程中对那些催化裂化的装置所造成的影响,通过对原料、操作等方面进行一定的分析和调整,然后提升焦化蜡油的加工工艺,使得整个流程得到有效的
背景肺隐球菌病(PC)主要是由新型隐球菌及Gattii隐球菌引起的一种肺部真菌性疾病。主要发生在HIV患者及其它免疫功能低下人群中,也有少部分免疫能力正常者患病。相关报道显示
目的 观察四神丸加味治疗慢性结肠炎的临床疗效。 方法 86例确诊为慢性结肠炎脾肾阳虚证患者随机分为观察组和对照组各43例。观察组内服四神丸加味,对照组内服酪酸梭菌活性
做媒体融合时代的“深度”内容,是锻炼一种“新本领”,而不是把传统媒体时代练就的熟练套路用新媒体的外壳包装一下。