基于深度学习的蛋白质功能预测研究

来源 :青岛科技大学 | 被引量 : 1次 | 上传用户:liangjielin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物医学大数据的到来,通过蛋白质组学数据挖掘其潜在的生物学价值,对于研究分子间作用机理、药物设计和人类疾病防治具有重要意义。而利用实验的方法是耗时且耗费资源的,运用计算方法预测蛋白质功能显得尤为重要。随着深度学习的蓬勃发展,通过深度学习预测蛋白质-蛋白质相互作用(ProteinProtein Interactions,PPIs)和药物-靶点相互作用(Drug-Target Interactions,DTIs)已经成为生物信息学的研究热点。本课题基于深度学习预测PPIs和DTIs,主要研究内容如下:1.提出基于集成残差卷积神经网络(Ensemble Residual Convolution Neural Network)的蛋白质-蛋白质相互作用预测方法,称之为EResCNN。首先融合伪氨基酸组成(Pseudo-Amino Acid Composition,PseAAC)、自协方差描述符(Auto Covariance,AC)、伪位置特异性得分矩阵(Pseudo Position-Specific Scoring Matrix,PsePSSM)、分组重量编码(Encoding Based on Grouped Weight,EBGW)、互信息描述符(Multivariate Mutual Information,MMI)和三联体(Conjoint Triad,CT)提取蛋白质的物理化学性质信息、进化信息和序列信息。然后通过残差卷积神经网络的逐层学习能力挖掘PPIs的高水平特征,集成全连接网络、LightGBM和极端随机树预测PPIs。五折交叉验证表明,在S.cerevisiae、H.pylori和Human-Y.pestis数据集上的总体准确率分别为94.88%、88.24%和97.88%,优于主流的蛋白质-蛋白质相互作用预测方法。EResCNN在H.sapiens、M.musculus、C.elegans和E.coli的ACC分别为95.25%、96.49%、92.08%和92.13%,具有优良的跨物种预测性能。网络预测结果表明,EResCNN可以用来探索蛋白质-蛋白质相互作用网络的拓扑结构和生物医学意义。2.提出基于深度神经网络(Deep Neural Network,DNN)的药物-靶点相互作用预测方法,称之为DNN-DTIs。首先利用伪氨基酸组成(PseAAC)、伪位置特异性得分矩阵(PsePSSM)、三联体(CT)、组成、转变和分布(Composition,Transition and Distribution,CTD)、Moreau-Broto自相关以及二级结构特征表征蛋白质靶点信息,使用PubChem数据库中分子亚结构指纹表征药物信息。其次使用XGBoost特征选择剔除冗余和不相关的特征,利用合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)平衡样本数据集。最后构建基于深度神经网络(Deep Neural Network,DNN)的药物-靶点相互作用预测模型。五折交叉验证表明,DNN-DTIs在酶(Enzyme)、离子通道(IC)、GPCR和核受体(NR)数据集上的预测准确率分别为98.78%、98.60%、97.98%和98.24%,优于其它的药物-靶点相互作用预测方法。为进一步评估DNN-DTIs的优劣,我们预测并绘制了药物-靶点相互作用网路,可以为药物设计和鉴定新的DTIs提供新的思路和途径。
其他文献
在日益激烈的市场竞争中,企业由于财务风险控制上存在漏洞,进而引发财务危机的现象不胜枚举。基于权责发生制的传统财务分析方法,受会计政策和人为因素的影响,弊端也逐渐凸显
质询技巧以教科书为主的被动技巧应于不遗余力地避免,因这类方法只鼓励学生寻找信息、记录或背诵,实验室课也仅为了演示定律、原理及科学内容而已。应在课堂上培养开放性的
期刊
<正>Klinefelter综合征(Klinefelter Syndrome,KS)是男性最常见的性染色体异常疾病,发病率约1/600-1/660[1],80-85%KS患者核型为47,XXY,非嵌合型。不育是其就诊的主要原因,精液
中小企业是我国国民经济发展中不可或缺的组成部分,是推动国民经济发展促进社会稳定的基础力量。国家统计局数据显示,2018年末,中小企业36.9万户。其中,中型企业5.0万户,小型
描述了典型化工厂循环水场通过对非氧化杀菌剂按不同投加浓度,进行静态杀菌试验研究和评价,得出循环水系统中非氧化杀菌剂投加的最佳配方。按此投加配方,投加该非氧化杀菌剂
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
通过对上海软土地区的几个地铁车站深基坑工程的地下连续墙的弯矩和钢筋应力进行跟踪分析,得到了这些基坑地下连续墙所受弯矩的包络图,并与地下连续墙能承受的弯矩极值进行对
土壤质量评价中碳氮指标的表示方法很多,其中生物活性碳、氮能敏感地反映土壤质量的变化,是重要的评价指标,但其测定困难,在土壤质量评价中的认识并不统一。本文对《土壤质量与持
本文以系列不同碳链长度、不同氧乙(或丙)烯链节数的烷基醇醚和氯乙酸为原料,在粉状NaOH存在的条件下,按照羧酸基化法合成了15种醇醚羧酸盐(AEC)表面活性剂。采用碱性介质中
当前世界经济已从工业主导经济转入服务主导经济,服务型制造成为制造业转型升级的重要方向,服务创新也已成为制造企业竞争优势的重要来源。中国制造业正由高速度发展转向高质