基于散射卷积神经网络的蛋白质二级结构预测

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:gmgan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质二级结构预测在生物信息学领域具有重大意义,对充分了解蛋白质的功能和结构是十分必要的,科学家们从未停止对蛋白质结构的研究。本文主要使用了深度学习模型来进一步提高蛋白质二级结构的预测准确率,本文的主要工作包括以下几个方面:
  (1)基于优化的卷积神经网络的方法。首先本文对蛋白质数据进行处理,将CASP11数据集作为验证集,并建立初始的卷积神经网络模型,然后将卷积神经网络的层数、学习率、梯度冲量和正则化系数四种超参数配合训练集和验证集构建贝叶斯优化算法,其次通过训练网络,经过贝叶斯优化得到最优的网络结构和参数,最后在测试集CASP10,CASP11和CB513数据集上获得了81.36%,80.83%和84.29%的Q3预测准确率。
  (2)基于优化的卷积和BiLSTM网络的分类方法。该模型将优化的卷积神经网络和BiLSTM神经网络相结合,利用蛋白质特征矩阵预测蛋白质二级结构。优化后的卷积神经网络可以提取蛋白质序列中复杂氨基酸残基之间的局部特征。此外,BiLSTM神经网络可以进一步提取氨基酸之间复杂的远程相互作用。实验结果表明,本文提出的模型能够取得较好的效果。
  (3)基于生成对抗网络和卷积神经网络的预测方法。本文将生成对抗网络和卷积神经网络相结合,提出了基于生成对抗网络和卷积神经网络相结合的方式去进行蛋白质二级结构的预测。生成对抗网络能够提取蛋白质序列之间氨基酸残基的特征,并将提取的特征与原始蛋白质特征融合之后利用卷积神经网络预测蛋白质二级结构。在CASP9,CASP10,CASP11,CASP12,CB513和25PDB数据集上分别获得了87.06%,87.24%,87.31%,87.39%,88.13%和88.93%的Q3预测准确率。实验结果表明,Q3预测准确率得到了显著提高。
  (4)基于小波散射和卷积神经网络的分类方法。利用小波散射提取蛋白质数据的特征,由于小波散射网络中具有不同的尺度,所以设置不同的尺度进行分析。将通过小波散射网络提取到的不同的蛋白质特征利用卷积神经网络进行结果预测。因此,本章将采用小波散射网络与卷积神经网络结合起来进行特征二次处理达到了较好的分类效果。
  实验表明,在本文所使用的方法中,使用公开的测试集来测试本文所使用的模型,通过贝叶斯优化卷积网络,结合BiLSTM网络模型,利用生成对抗和卷积神经网络,使用小波散射网络和卷积神经网络,本文所用的方法都比单独使用卷积神经网络得到的Q3准确率高。这就证明了,本文所提出的模型是切实可行的,并且都提高了Q3预测准确率。
其他文献
目前我国地处偏远、环境复杂的油田普遍存在石油钻井物料供应成本高、效率低下的问题,为避免钻井作业物料短缺,保证钻井过程物料的质量及生产需求响应速度,本文将众包思想融入石油钻井物料供应链中,通过网络众包方式,使众多的钻井物料供应方参与到钻井企业物料供应中,并运用众包供应链的组织流程和结算管理模式,设计并实现了一个基于众包的石油钻井物料供应链系统,为传统石油钻井物料供应提出了一个新思路。主要的研究工作如
三维海洋场景的模拟是计算机图形学场景建模研究内容之一。海洋与其他自然场景不同之处在于海洋场景往往具有随机性,模拟起来具有一定难度。目前的海洋的仿真场景中对于海面光照模拟没有进行细致的划分,只是使用简单的光照模型进行渲染,并且场景中对于海面漂浮物分析不够全面。本文实现一个完整的三维海洋场景,对于海面的光照渲染综合海面上和海面下的渲染,更加真实地模拟海洋场景中光的效果,并且对海面漂浮物进行模拟,对物体
学位
在高速发展的信息时代,数据在各个行业中都已成为一种无形资产,但随着近些年有关数据安全的问题频发,引起了相关政府企业的高度重视,对敏感数据进行加密或者脱敏成为目前研究的一个重点。数据脱敏相较于加密来说它的不同之处在于需要尽可能不留痕迹的将敏感数据替换成非敏感信息。但是,目前数据脱敏技术大都仅能针对文本类信息,针对该现象,本文选取油气勘探领域作为研究对象,聚焦其中带有敏感信息的曲线图像数据,根据曲线结
学位
计算机组成原理是计算机类相关的一门重要的专业基础课,由理论和实验两部分组成,控制器的设计实验是理论知识应用的重要环节,在传统的教学实验中学生只能通过实验箱观察实验结果,不能便捷地看到设计中存在的问题,如果在实验环节增加调试系统可以帮助学生看到模型机内部的数据变化过程,发现组件、数据通路和控制器设计中存在的问题。RISC-V指令集架构短小精悍,编码规范,解决了以往指令集中存在的问题,RV32I是RI
学位
通常在地震勘探中采集到的地震资料因受各种因素的影响常常混杂着大量噪声,如果能有效的消除地震信号中的噪声干扰,这将为后续解释工作提供极大的保障。所以本文从消除地震信号随机噪声提高地震资料信噪比方向展开研究,主要研究内容如下:首先,本文介绍了小波变换由理论知识到实际应用的内容与流程,深入分析了常用小波阈值选取算法的优缺点。然后,研究改进了小波变换阈值去噪算法去除地震资料随机噪声。本文针对常用小波阈值去
学位
人体的健康状态可以依靠人体生理信号来反映,实时监测人体的生理信号参数可以及时分析与诊断患者病情。随着各类便携式智能移动设备和人工智能的快速发展,在对疾病筛查和预测过程中,除了可以通过生化、影像检查结果发现疾病的端倪外,还可以通过移动智能设备对人们的语言和文字形成的规律进行分析,这种分析得出的数据能够帮助医生更有效地预测并追踪早期的发展障碍、精神疾病和退化性神经疾病等。本文设计的人体多生理参数数据处
学位
卷积神经网络(Constitutional Neural Networks,CNN)具有良好的非线性拟合性,因此被广泛应用于图像分类,语音识别和目标检测等领域。随着CNN的发展,模型的大小和计算量剧增导致CNN模型只能在特定平台使用,无法实现专有化和小型化。现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)具有高性能、低功耗及可重构等特点,在进行CNN加速
现如今,物联网技术将世界变成一个万物互联的时代,嵌入式设备与物联网的结合成为了嵌入式技术发展的真正未来。天然气作为一种高效清洁的能源,在国内呈现需求日益旺盛的态势。而天然气的开发环境恶劣,天然气井控制器的应用就为天然气开采和管理提供了技术支持。目前的气井控制器的设计以进口CPU为主,国产龙芯CPU的发展为我国摆脱技术依赖提供了新的支持。基于此,本课题开发了一款基于国产龙芯CPU的气井控制器。通过对
水质检测是水保护的前提和基础,生化需氧量(Biochemical Oxygen Demand,BOD)、化学需氧量(Chemical Oxygen Demand,COD)、亚硝酸盐能够很好地反映水污染的程度。研究上述参数的快速检测,可为水资源保护提供有效的数据支持。研究基于高光谱技术的水质指标定量研究,可快速、无接触、大面积的实现水质的实时检测,对我国目前的水污染治理问题提供理论依据具有极为重要的
学位
在高校智慧校园建设过程中,学业预警作为智慧校园的主要组成部分,其主要利用数据挖掘技术保障学生顺利完成学业,同时为高校提供一定的决策支持。本文以某校相关部门的研究课题为背景,旨在搭建适用于该校的学业预警系统,保障学生顺利完成学业。主要研究内容分为“学业预警模型研究”和“学业预警系统设计与实现”两个部分,其详细内容如下:在学业预警模型研究的过程中,以某校本科生的历史成绩数据、一卡通消费数据和图书馆刷卡
学位