基于表型的罕见疾病辅助诊断系统

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:lcp396526202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
罕见疾病是指发病率极低的疾病,由于包含的种类繁多且关联的表型复杂多样,导致临床医生对罕见疾病的认识不足,往往无法将罕见疾病患者从大量的患者中准确的识别和诊断出来。为了解决上述问题,本文整合多层次的生物医学数据和多种分类器,引入在含有噪音的数据上对于其它计算模型具有优势的机器学习算法,构建了罕见疾病辅助诊断系统RDAD(Phenotype-based Rare Disease Auxiliary Diagnosis System)。通过利用eRAM、OMIM、Orphanet等来源的数据和文本挖掘得到的数据,然后基于人类表型本体的语义层次结构,根据表型外显率等信息计算表型TF-IDFHierarchy信息量,并且利用上述罕见疾病-表型关联数据和表型-基因关联数据,分别构建了基于表型信息量的罕见疾病相似度模型(PICS)、基于表型-基因关联的罕见疾病相似度模型(PGAS)、基于人工筛选特征表型空间向量的罕见疾病机器学习预测模型(CPML)和基于人工筛选与文本挖掘特征表型空间向量的罕见疾病机器学习预测模型(APML),最后利用根据真实病历数据提取到的测试数据集验证了上述四个罕见疾病预测模型的准确性。结果显示,上述四个模型均具有很高的预测精确率(≥98%)和可接受的预测召回率(≥67%),其中CPML模型同时具有很高的预测精确率(≥99%)和很高的预测召回率(≥95%),也是本文推荐使用的模型。与此同时,本文完成了RDAD网站平台的开发,RDAD网站主要提供了两个功能:罕见疾病注释信息卡片和罕见疾病预测。用户可通过链接http://www.unimd.org/RDAD/进行访问。
其他文献
分析和比较了当前已有教学实验平台的优缺点,尝试结合项目化教学理念,构建了一套以嵌入式系统设计自身特点为基础,面向不同专业需求的实验开发平台。为高等院校的嵌入式教学
光束的聚焦特性和光谱特性是现代光学的重要研究内容,对现代光学和激光技术的发展具有重要意义。 本文首先介绍了研究光束传输变换的基本理论和分析方法,以及描述部分相干
随着计算机和统计学的发展,船舶智能化和数字化发展成为主要趋势,而船舶装备的大型化、多系统和复杂化成为当前船舶装备的主要特征。船舶主机是船舶的主要部分,其系统结构复杂且故障变化多种多样,现阶段基于故障特征和故障样本的诊断方法由于无法获得全面的故障样本,因此很难取得实用成果,这也是近十年来故障诊断理论和方法很难在工程中实际应用的主要原因。数据驱动下状态监测技术是基于统计和设备状态进行故障预测和维修规划
针对密闭/半密闭舱室二氧化碳清除技术的应用现状,总结分析了各种二氧化碳清除技术的研究进展。对各种清除剂的不同参数进行了比较性评价,如耗能、装置体积、二次污染、吸收效果
翼状胬肉是农村常见的、多发性的眼表疾病,严重者给患者视力带来了工作和生活的很大不便。目前缺少切实、有效的治疗方法,治疗多以手术为主。但复发率较高,使医、患双方都感到比
对镍基高温合金,尤其是单晶和定向凝固镍基高温合金进行超声检测时,因其组织特殊,实际构件几何形状多样,声传播行为显示出强烈各向异性;同时,合金的服役状态为热处理态,热处
介绍了基于AT91RM9200处理器的嵌入式开发板的设计调试过程。阐述了外围接口和存储模块的设计,以及各模块底层测试程序的编写要点,详细介绍了利用DBUG串口进行基于AT91RM9200处