用机器学习方法预测非编码RNA-蛋白质相互作用关系

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:zerotx01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非编码RNA(noncoding RNA,ncRNA)在许多生命过程中扮演着重要角色,例如RNA加工修饰、病毒复制、人类疾病等,通常ncRNA通过与蛋白质发生相互作用行使功能,所以研究ncRNA功能的关键一步是确定非编码RNA-蛋白质的相互作用(noncoding RNA-protein interactions,ncRPI)。目前,实验的方法确定ncRPI价格昂贵且耗时,因此本研究提出一种计算的方法,从ncRNA和蛋白质的序列提取特征,训练四层的卷积自编码器做特征预处理,不但降低原始数据的维度,而且能够挖掘数据间的隐含信息,提高预测的准确率。运用网格搜索法训练三个机器学习模型,随机森林(Random Forest,RF)、极端梯度增强算法(Extreme Gradient Boosting,XGBoost))和Light GBM来预测ncRNA与蛋白质的相互作用,实验结果表明三个模型在RPI369与RPI488两个小规模数据集都达到了较高的预测准确率,在RPI369数据集三个模型的预测准确率分别为0.791(RF),0.791(XGBoost)和0.757(Light GBM),在RPI488数据集三个模型的预测准确率分别为0.908(RF),0.918(XGBoost)和0.918(Light GBM);三个模型在RPI1807、RPI2241、RPI13254三个大数据集也取得了较高的AUC(Area Under Curve)值,在RPI1807三个模型的AUC值均为0.99,在RPI2241三个模型最低AUC值为0.87,在RPI13254三个模型最低AUC值为0.81,都表现出有效的预测准确性,能够较准确地预测ncRPI。因此,该方法能够预测ncRNA与蛋白质是否存在相互作用,可用于二者相互作用预测的研究。
其他文献
驾驶模拟器不仅在汽车产品研发、驾驶培训等传统领域应用广泛,也为汽车辅助驾驶、自动驾驶这样的前沿科技带来了新的可能性。然而生产成本高、沉浸感不强成为了这项技术的发展瓶颈,使其难以在普通用户中推广普及。因此开发一种成本低、动感真实的汽车驾驶模拟器具有重要的现实意义。经过分析,本文将汽车驾驶的各种运动分解成俯仰、侧翻和升降三个运动或其组合运动,设计了一种具有两个转动自由度和一个移动自由度的三自由度并联运
从改革开放到2020年全面建成小康社会,四十多年的招商引资不断改变着中国经济发展格局,现中国经济已处于中低速稳定增长阶段。国务院层面就多次关于引进外资出台相关政策,大力引入外资已是势不可挡的趋势。外商直接投资(FDI)作为经济增长的推动剂,可以提高城乡人民的生活水平,促进偏远地域的经济发展。但是由于FDI流入量在行业以及区域之间有差别,导致城乡经济发展速度不一样,FDI将对城乡居民收入差距造成一定
长江后浪推前浪!晋宁已然成为中国『最大的花卉基地县』。『晋宁鲜花的发展比呈贡晚,但斗南市场上70%的鲜花是晋宁产的。』晋宁县农业局局长吴云和说。
凸轮机构广泛应用于汽车、航天等工业领域,但是凸轮与从动件的高副接触导致的大应力使其极易发生磨损而失效。由于凸轮的轮廓复杂,难以快速获得其表面形貌,导致凸轮机构磨损失效位置的诊断和优化变得困难。本文提出一种凸轮机构基于载荷谱的故障诊断方法,并在此基础之上提出两种凸轮机构优化设计方案,以期为凸轮机构的快速故障诊断和设计优化提供参考。本文以一个小型凸轮机构为例,结合载荷谱技术介绍了此方法的原理和实现过程
本文基于较为全面的文献资料和比较翔实可靠的第一手田野调查资料,对水磨这一曾经是先进生产技术的发明及其传播和演变、水磨在人们生活中地位的变化、与当地人民生活的关联、人们对水磨面粉的态度与情感、水磨主及其家族的故事、水磨与当地居民经济生活、社会生活、文化生活的关联等等方面的问题进行展示及讨论。使用科技人类学的方法,分析在生产力发展下,水磨这一技术的出现、发展到逐渐被电磨坊替代的一系列现象。整个论文除前
股票回购既是上市公司重要的股利政策,也是完善公司治理结构、优化企业资本结构的重要手段。公司在股票回购完成后可以将所回购的股票注销。也可以将回购的股票作为“库存股”保留,不再属于发行在外的股票,且不参与每股收益的计算和分配,待日后移作他用。股票回购作为西方国家优化公司股权结构的方法,在20世纪80年代的国外成熟资本市场上得到了广泛应用,股票回购的股利替代功能和资本结构优化作用得以广泛证实。自20世纪
随着科技的进步和时代的发展,人类信息安全面临巨大的挑战,身份识别技术成为研究热点。生物特征识别技术是基于个人独特的生理或行为特征进行自动身份鉴别的技术,是一种相比
目的:本研究旨在明确绿茶多酚(Green tea polyphenols,GTP)预处理对小鼠长时程异氟醚麻醉后认知功能的影响,以及从氧化应激方面探讨其可能的作用机制。方法:取8周龄雄性C57BL/6J小鼠分组:对照组(Con),麻醉组(Anes),多剂量GTP给药组(GTP-MD),多剂量GTP给药+麻醉组(GTP-MD+Anes),单剂量GTP给药组(GTP-SD)、单剂量GTP给药+麻醉组(
嵌入式加密芯片作为加密算法实现的重要载体之一,在信息安全领域所面临的挑战不仅来自理论上的攻击,还存在针对其物理实现的攻击。即使数据加密,仍不能保证传输过程中的正确
电熔镁砂是一种熔点高、抗氧化性和抗渣性强的高级耐火材料,被广泛用于航空航天、核工业、冶金等领域。电熔镁砂生产工艺复杂,外界扰动频繁,对控制算法的要求较高,而传统的PL