基于机器学习的非编码RNA与疾病关系预测

来源 :海南师范大学 | 被引量 : 1次 | 上传用户:lizhe_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNA(miRNA)和long non-coding RNA(lncRNA)是两种拥有不同转录本长度的非编码RNA。研究发现,miRNAs和lncRNAs都在人类许多生物学过程中扮演着重要角色,它们的失调可能导致诸如癌症等多种疾病,探究miRNAs、lncRNAs与疾病的潜在关联有助于了解疾病的发病机制,并及时做出诊断、治疗以及预后等措施。然而,传统的生物学实验成本高、耗时长,因此,开发有效的计算模型具有重要意义。机器学习方法在解决预测问题中有很多的应用。本文主要研究基于矩阵完成的计算模型预测miRNAs与疾病潜在关联以及基于网络算法的模型预测lncRNAs与疾病潜在关联。对于miRNAs与疾病关联的预测,借助lncRNAs与疾病的关联数据作为辅助信息,应用基于矩阵完成的方法进行预测。将从数据库下载的已知的miRNA-疾病关联数据以及lncRNA-疾病关联数据进行整合,然后构建映射网络,根据映射网络的不变性的性质构建负样本,最后以相似度作为边信息,将miRNA-疾病关系的预测转化为低秩矩阵完成问题,采用交替梯度下降法求解模型。5-fold交叉验证(5-fold CV)结果显示ROC曲线下面积(AUC的值)为0.8884,超过了近几年提出的一些方法。对于lncRNAs与疾病关联的预测,开发了一种在多层异构图上进行带重启的随机游走算法。用下载的已知的lncRNA-疾病关联数据计算多种相似性构成多种相似性网络,与lncRNA-疾病关联网络构建成多层异构图,在多层异构图上进行带重启的随机游走,利用稳定概率预测潜在的lncRNA与疾病关联。留一交叉验证(LOOCV)的结果显示,AUC的值为0.8581,与近年来预测lncRNA-疾病关联的经典算法相比有了明显提高。最后,本文对模型进行了总结,并对未来的研究进行了展望。
其他文献
近年来卫生部资料调查显示,心血管和呼吸系统疾病的发病率位于前列,并有逐年升高的趋势。这些慢性疾病通常门诊表现为急性发作,针对该类疾病的预防对诊疗系统具有十分重要的
近场动力学理论(Peridynamics,PD)是一种非局部作用方法,将传统的微分运动方程改写为积分形式,能有效处理材料中的不连续问题,得到材料在载荷作用下的损伤路径。近场动力学将
近年来,物联网呈现出迅猛的发展势头,特别是在智能制造、智能家居、车联网、环境保护等领域。物联网设备一般通过WI-FI、蓝牙、蜂窝网络或低功耗广域网络连接到网络,这通常需
超声扫查因其价格低廉、实时监测、非侵入以及无辐射等优点,已成为临床中最为普及的常规检查成像方法之一。大量的超声扫查需求导致超声科医师临床扫查任务繁重,极易遭受重复
二十一世纪以来,烧结NdFe B作为市场发展潜力最大的永磁材料,以其突出的磁性能被广泛应用于电子设备。但是随着市场需求的不断扩大,钕铁硼的应用因其矫顽力和腐蚀性的影响受
图像特征的提取和表达可用于计算机视觉各个领域的研究和应用,针对视频流数据的特征提取、描述、匹配及跟踪的相关研究也是机器视觉研究的重要组成部分和研究热点。然而,现有
铁路作为货物运输和国民出行的主要交通运输方式之一,是一个国家经济实力的具体体现。捣固车作为对铁路进行作业与维修的主要工具,具有至关重要的作用。捣固车的工作环境恶劣
近年来,随着多智能体系统理论研究和实际应用发展,很多研究学者开始关注多智能体领域。多智能体系统的主要研究方向大致可以分为编队、聚集、优化、一致性等。其中一致性问题
本文利用溶剂热法和直流电弧法成功制备了具有形状各向异性的多面体微纳米Fe粉。采用X-射线衍射仪、扫描电镜、X-射线光电子谱等手段,对所制样品的微观结构、形貌、组成成分
地空宽带通信信道的快时变特性,导致系统服务质量(Quality of Service,QoS)无法保证,地空通信的频谱利用率无法提升。自适应调制技术可根据信道质量动态调整调制方式适配信道