基于语义相似性和等级结构数据计算基因间表型相似性

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户:ashwgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表型相似性和基因功能的多个方面密切相关,例如基因表型相似性和蛋白质互作是相关联的。基因发生缺失或变异对其表型的影响亦是基因注释的一部分,目前,对该领域的研究日益受到广泛的关注。然而,基于人类表型本体论(Human Phenotype Ontology,HPO)数据研究基因表型相似性的方法并不多见。因此,研究和开发行之有效的算法很有必要。本课题利用来自人类表型本体论数据库中等级结构数据和基于语义相似性的五种测度(Jiang and Conrath’s,Lin’s,Schlicker’s,Yu’s和Wu’s)计算人类基因间表型相似性。此外,本文还提出新的结合余弦和基因注释水平计算基因间表型相似性的方法。并分别利用蛋白质-蛋白质互作、蛋白质复合物、蛋白质家族、基因功能和DNA序列等信息来评估这些算法的正确率和性能。对每种方法都做了1000次随机,并与实际计算结果进行了比较。结果表明,这些方法计算得到的结果与随机比有显著差异(P<0.001)。此外,本文还用receiver operating characteristic (ROC)曲线分析方法对这六种方法的性能进行了评价。研究表明,六种方法的性能大部分优于先前的文本挖掘方法。本课题证实了基于语义相似性测度和等级结构数据及结合余弦与基因注释水平都能有效的计算基因间表型相似性。本课题的结论为研究、开发和优化计算基因表型相似性算法提供了更多更有意义的帮助,并为从事该领域的研究人员提供了更多可选择的计算工具。
其他文献
为了保证列车在高速、大运行密度的条件下安全运输,铁道部制定了中国列车控制系统(CTCS)标准,并基于欧洲列车控制系统(ETCS)展开了对CTCS技术的研制和开发。本文在对CTCS中的
无运动部件变焦(optical zoom without macroscopic moving elements)是指在没有光学部件宏观上相对位移的前提下实现光学变焦的过程。作为一种新型的光学变焦技术,宏观运动部件的消除不但可以使其应用到对空间、功耗或稳定性有苛刻要求的场合,而且能够提升变焦的时效性,因此极大地拓展了变焦技术的应用范围。目前,美国、德国、法国、中国等均已开展了将无运动部件变焦应用于
计算机技术飞速发展,互联网由单纯的“读”向“写”迈进,人们由被动地接收向主动创造互联网信息转变。个人移动通信设备日益普及,分布式网络应用程序需求不断扩展,基于PC机的
随着科学技术的不断发展,产品的数字化、精确程度在很多系统中起着至关重要的作用。很多产品需要基于模数转换器(ADC)进行测量,将检测的模拟信号表示为数字信号,以便于更好地传
许多研究表明带有GC端粒的低聚核苷酸可以自重组形成G-DNA四链体。G-DNA四链体是DNA的一种二级结构,它存在于某些富含鸟嘌呤G的DNA序列中。G-四链体结构的形成能够维持基因组