【摘 要】
:
RNA结合蛋白位点的鉴定对细胞生物学在转录、转录后、翻译和翻译后水平至关重要。研究表明,lncRNA可与DNA、RNA和蛋白质相互作用从而调节各种生化过程。值得注意的是,lncRNA与蛋白质相互作用的预测对于研究分子机制、了解疾病的发病机理以及解释lncRNA的功能是必要的。因此,构建一个高性能的系统来预测lncRNA与蛋白质相互作用,对其功能进行注释,对农作物发展和相关研究具有重要意义。本文旨在
论文部分内容阅读
RNA结合蛋白位点的鉴定对细胞生物学在转录、转录后、翻译和翻译后水平至关重要。研究表明,lncRNA可与DNA、RNA和蛋白质相互作用从而调节各种生化过程。值得注意的是,lncRNA与蛋白质相互作用的预测对于研究分子机制、了解疾病的发病机理以及解释lncRNA的功能是必要的。因此,构建一个高性能的系统来预测lncRNA与蛋白质相互作用,对其功能进行注释,对农作物发展和相关研究具有重要意义。本文旨在基于不同的数据形式探讨植物基因组学与深度学习的交叉。为了通用性和探索不同的模型设计原则,利用生物信息技术基于不同的特征提取和选择方法来开发lncRNA-蛋白相互作用预测算法,并基于互作关系进行功能推测。在拟南芥和玉米数据集上进行了实验,验证所提出方法的性能。中心假设是指未知功能的lncRNA可能与相似蛋白相互作用并展现出相似的功能,这可以通过分析它们的相互作用得以了解。其主要的挑战包括特征工程以及针对目标域/基因组知识的深度学习模型学习到的表征解释。首先,提出了基于最优序列特征的高效深度学习模型来预测lncRNA与蛋白质的相互作用。由于lncRNA序列较长,因此使用循环神经网络来捕获上下文长程信息依赖性。然后采用递归特征消除算法进行特征选择以获得最优的性能。在两个植物物种上分别获得了 88.12%和90.74%的准确率。其次,提出了使用图表示学习和结构特征的深度学习模型来预测lncRNA和蛋白质的相互作用。该模型证明了混沌博弈表征和图注意力相结合的有效性,在两个植物物种数据集上的准确率分别达85.76%和91.97%。第三,提出了融合序列及结构特征和采用自注意力机制的多模态集成学习方法,证明了模型在lncRNA和蛋白质相互作用预测中的可扩展性和可解释性。所采用的技术显著提高了性能,在两个植物物种数据集上分别获得了 89.50%和92.32%的准确率。最后,提出了深度神经网络和集成学习的混合算法并预测lncRNA和蛋白质的相互作用,并分析相互作用对lncRNA进行功能注释。实验结果表明,由于lncRNA-蛋白质相互作用很大程度上受序列互补性影响,序列信息只能可靠预测相互作用。在两种植物物种上预测的准确率分别为89.98%和93.44%。又研究了影响深度学习预测性能的关键因素,证明了提出方法对相互作用预测改进的研究价值。本文框架包含了大规模lncRNA和蛋白质数据的综合分析方法,以用于相互作用预测和功能分析。期望所提出的方法具有广阔的前景,以扩展对植物lncRNA与蛋白相互作用以及lncRNA功能研究的认识。
其他文献
毕节市某羊场发生疫病,经病原核酸检测,病羊为羊口疮与支原体混合感染所致。通过2017-2020年对羊场的净化处置,成年羊、育成羊、羔羊的羊口疮发病率分别从2017年的6.28%、9.38%、27.97%下降到2020年的3.39%、5.63%、10.48%;流产、死胎母羊占比分别从2017年的12.36%、10.11%下降到2020年的4.46%、3.18%;羔羊死亡率从2017年的54.25%下
化学计算是初中化学教学的难点。经过分析,笔者发现,在河南省近五年的中招化学考试中,学生在化学计算方面得分率偏低。分析这类得分较低的化学试题发现,学生主要存在数据处理错误、搞不清数据之间的关系、利用化学方程式计算时格式错误等问题。针对这些问题,教师要引导学生理解化学概念、原理,掌握化学计算方法,培养分析解决问题能力。
针对城市中宠物饲养管理普遍存在登记信息和卫生疫苗管理情况混乱、宠物走失事件频发等问题。提出一种新型物联网(IoT)宠物项圈设计。智能宠物项圈核心使用STM32L151C6T6超低功耗单片机作为主控模块,包含窄带物联网(NB-IoT)、NFC、GPS、墨水屏等重要功能与部件,并具有防盗报警功能。软件部分使用C语言进行程序设计,实现了NB-IoT数据上传下载、NFC数据读取写入、丢失报警等功能。
燃料电池是一种极具前景的清洁能源转换装置。其中,阴离子交换膜燃料电池(AEMFCs)因其氧还原活性高,可使用非贵金属催化剂,成为研究热点。作为AEMFCs的核心部件,阴离子交换膜(AEMs)的OH-传导率和碱稳定性是决定AEMFCs性能和寿命的关键。然而,常用主链型聚芳醚类AEMs结构中的吸电基(例如C=O和O=S=O)和邻位苄基阳离子会加速主链的芳醚裂解,成为制约聚芳醚在AEMs中应用的关键问题
现代工农业生产过程,会造成过量的镉(Cd)和铅(Pb)排放,污染土壤。Cd/Pb属于毒性金属,会对动植物的生长发育产生危害。土壤中过量的Cd/Pb会通过食物链传递和富集,对人类健康造成威胁。治理土壤Cd/Pb污染迫在眉睫。植物修复技术是一种绿色、经济、无二次污染的重金属污染土壤治理方法,具有广阔的发展前景和利用空间。杨树生长迅速、生物量大、适应力强,在修复Cd/Pb等重金属污染土壤中具有巨大潜力。
在我国实现工业化的过程中,涌现出了一大批资源型城市,其对自然资源的大规模开发利用极大地促进了我国社会经济的发展,为我国的经济腾飞做出了难以磨灭的贡献。然而随着对资源持续地高强度开发,相当多的城市面临着资源枯竭或已经枯竭的困境。而且这些城市在早期发展过程中,缺乏环保意识与可持续发展意识,生态环境已遭到严重破坏,同时城市对资源型产业存在严重的路径依赖,缺乏接替产业,城市转型面临巨大的挑战和困难。资源型
数据分类是机器学习领域中一种重要的数据处理方法,其主要任务是通过归纳和学习一系列带有类标签的数据样本,去建立一个能反映样本和标签之间映射关系的模型。在当今信息化的时代,数据通常会包含多层次、多视角的知识和信息,因此关于如何从人类处理复杂问题的思路出发去解决分类问题是值得深入研究的。粒计算作为一种新兴的信息处理方法,能够模拟人类认知、分析和处理问题的方式去处理分类问题,且可以帮助用户探索数据中隐藏的
近年来,随着资源要素稀缺程度的不断上升和信息技术对地方政府精准评估企业生产率能力的提高,越来越多的地方政府开始采纳从浙江省兴起的集约导向型政府干预。这一新型的政府干预以地方政府综合多部门掌握的数据评估出的企业生产率为依据,旨在通过政府干预差别化企业要素使用成本,促进资源要素向高生产率企业集中,实现区域内要素资源的集约利用。直观上来看,集约导向型政府干预将优化区域内的要素配置,进而提升地区生产率,但
阴离子交换膜燃料电池(AEMFCs)可实现氢能的高效利用,满足国家重大需求。碱性条件下,燃料电池具有更快的氧还原动力学,可使用非贵金属催化剂。然而,作为阴离子交换膜燃料电池中的关键组件,阴离子交换膜(AEMs)的OH-本征迁移率低,OH-进攻下阳离子基团和聚合物主链易降解,造成其离子电导率低、碱稳定性差。设计膜材料的分子结构促进微相分离,可以有效地构建OH-传导通道,进而提高膜的OH-电导率。采用
宇宙学标准模型(CSM)以广义相对论(GR)为引力理论基础建立。在背景演化上,CSM包含了暴胀和后期加速膨胀两个阶段。两次加速膨胀的存在是CSM符合观测数据的基础,但二者产生的机制尚不清楚。本文以Poincaré规范引力(PGG)理论为基础,研究暴胀和后期加速膨胀产生的机制。基于以上考量,第1章(绪论)简要介绍了 GR和CSM以及规范场论的发展历史。第2、3、4章分别介绍了 PGG的运动学、动力学