深度学习在智能化药物设计中的应用初探

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lsxfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习作为一种新兴的机器学习算法,凭借其强大的数据处理和特征学习能力,在图像识别、语音识别、自然语言处理等诸多领域已得到广泛应用。近年来,深度学习在分子活性/功能预测与全新设计领域也取得了一些开创性研究成果,但相关理论和应用研究仍处于起步阶段。论文以深度学习中最具代表性的卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)为主要研究方法,根据两种算法优势和特点,分别对化合物ADMET性质预测以及全新分子设计进行了初步探索性研究。主要研究内容与结果如下:
  ①化合物ADMET性质预测研究。采用传统机器学习算法进行化合物活性/功能预测研究中,常以多种分子描述符为模型输入,同时需借助变量筛选技术剔除冗余结构信息。借助CNN强大的特征自动提取与筛选优势,论文以化合物2D结构图像为模型输入,分别对细胞色素P450(CYP1A2,2C9,2C19,2D6,3A4)抑制活性、P-糖蛋白(P-glycoprotein,P-gp)抑制活性、血脑屏障(Blood-brain Barrier,BBB)通透性和Ames致突变毒性进行了预测研究,并采用数据增强技术处理不平衡训练集样本,同时采用L2正则化、Dropout和Early stopping等策略来控制模型的过拟合。研究结果显示:以上8个体系的CNN模型外部预测准确性(Accuracy,ACC)分别为0.722,0.725,0.717,0.763,0.721,0.787,0.755和0.913。与传统机器学习模型相比,论文建立的CNN模型具有分子特征自动提取与筛选、不依赖分子三维结构、预测方法简便等诸多特点,尤其适用于高通量分子活性与功能预测研究。
  ②解整合素金属蛋白酶10(A disintegrin and metalloprotease10,ADAM10)抑制剂分子全新设计。论文基于化合物SMILES序列,采用基于GRU(Gated Recurrent Unit)的循环神经网络和迁移学习算法(Transfer Learning),成功建立了ADAM10抑制剂分子自动生成模型。研究结果显示:基于GRU的RNN模型对ChEMBL数据库中1128920个分子SMILES序列进行预训练后,可有效掌握分子SMILES字符串的格式规范与语法,其有效分子的生成比例可达到97%以上。在此基础上,采用2082个ADAM10抑制剂分子对GRU-RNN预训练模型进行迁移学习。回顾性研究结果显示:经随机采样生成500000样本后,模型对测试集ADAM10抑制剂的召回率(Recall)最高可达到27.79%。经Lipinski五规则筛选,论文对GRU-RNN模型生成的1465个阳性分子进行了Surflex-dock分子对接研究,并得到了211个具有潜在ADAM10抑制活性的目标分子。与传统计算机辅助药物设计方法相比,论文GRU-RNN分子生成模型具有操作简便、分子采样快速、分子生成有效性高等特点,可为今后智能化药物设计研究提供重要的参考资料。
  总的来说,论文初步探索了深度学习方法与技术在化合物ADMET性质预测以及分子设计领域中的应用,并取得了较为满意的研究结果。然而,受限于现有样本数据容量,深度学习的技术优势还远远没有得到最大程度的发挥,相信在不久的将来,深度学习在生物/化学/药物信息学以及智能化药物设计领域的强大技术优势将最终得以显现。
其他文献
番茄果实因其营养丰富、口味鲜美等特征而具有较高的市场价值,是一种被人们广泛种植的蔬菜作物之一。同时,番茄还是研究植物生长发发育的重要模式植物。然而在自然环境中,番茄往往受到各种不利环境的胁迫,其产量会受到不同程度的影响。目前,已有大量关于番茄非生物胁迫相关基因的生物学功能研究,使对番茄非生物胁迫响应机制有了一定的认识。然而少有报道番茄JAZ家族基因与非生物胁迫的关系,因此,鉴定新的与非生物胁迫响应有关的JAZ基因成为必要。此外,研究鉴定番茄优良抗逆基因,可以为茄科植物的抗性育种提供理论数据和参考。
摘 要:随着科学技术的深入发展和自媒体时代的到来,新媒体作为一种特殊的现实语境影响着大学生的道德行为、思想意识和价值观念,这给当今大学生思想政治教育提出了严峻的挑战。对于大学生而言,新媒体已经不单单是一种交流工具,更重要的是它已经成为大学生生活、学习不可或缺的重要部分。对新媒体下大学生思想政治教育的困境及出路进行研究,能够使高校思想政治教育工作者完善教育视野,理清教育规律,引导大学生树立良好的人生
期刊
摘 要:近些年来,随着我国经济,科技,教育等方面的快速发展,在我们为取得一系列重大发展成果而高兴的同时,互联网以其贯穿于各方各面的存在和产生的巨大作用引起了我们的高度重视。因此,网络时代下,充分认识并了解大学生思想政治教育的取向及存在的问题具有非常重要的意义,这就需要在学校、高校思想政治教育工作者、学生三者之间协调工作,充分明确网络时代的思想教育任务和面临的挑战,并对此作出有效的举措,在进行教育工
期刊
摘 要:本文通过对当前共享单车的发展现状进行分析,建立基于灰色预测的GM(1,1)模型,利用摩拜和ofo两大品牌2017年2-5月的月度日均活跃用户数量相关数据,对未来三个月的市场格局做了短期预测。  关键词:灰色预测 共享单车 格局预测  共享单车是指企业与政府合作,在校园、地铁站点、公交站点、居民区、商业区、公共服务区等区域提供自行车单车共享服务,是共享经济的一种新形态。但是共享单车的执行效果
期刊
摘 要:我国民族关系最普遍的体现就是混居,民族混居是指两个以上民族共居于一个地理单位内的现象。民族混居有不同的层次,可以是同住一县一市、一乡一镇,也可以同住一街一巷乃至一院一宅。混居的层次不同,对各民族接触与交往的影响也不同。本文以朝汉两组混居村落为调查对象,以口述史访谈和田野调查为方法,以吉林省果园村三对朝汉通婚的夫妻为立足点,并将村落自组织置于文化的各个层次中来考量民族关系。文化的不同表现形式
期刊
摘 要:随着共享经济时代的来临,共享物流创新模式随之产生。由于互联网+、大数据、物联网等技术的普及,共享物流得到了进一步的快速发展。本文立足于物流业发展现状,针对在物流环节所存在的问题,提出共享经济下的物流创新模式及发展建议,旨在促进良好的物流模式的建立,进而更好的促进物流业发展。  关键词:共享经济 共享物流 创新模式  随着经济全球化的不断推进,世界之间联系越来越紧密,经济实现共享的想法也随之
期刊
摘 要:建立功能服务党小组,为基层群众提供个性化、多样化、实用性服务是党组织各项工作中的关键部分,这也是党的建设中的一项新要求。目前一些地方在如何建立功能服务党小组、如何推荐功能服务党小组建设方面做了许多工作,也获得了一些成果,但是其中仍然存在一些薄弱环节。本文就对建立功能服务党小组实践进行详细分析,针对实践中的一些薄弱环节进一步充实、完善。  关键词:功能服务党小组 基层群众 探索 实践  一、
期刊
摘 要:推进农村土地流转,实现适度规模经营,成为农村经济社会发展的必然之路。本文分析了新型城镇化建设背景下农村土地流转中出现的动力匮乏、行为无序等问题,从土地确权,优化服务平台等角度提出促进土地流转的建议。  关键词:新型城镇化 土地流转 社会发展  一、土地流转存在的问题  1.流转动力匮乏。农户的土地流转意愿直接决定了土地流转能否顺利进行,对土地流转认识不到位导致流转意愿不足从根本上导致了流转
期刊
摘 要:本文以遂宁市电子商务产业发展现状为根据,与国内外电子商务研究现状情况相结合,找到遂宁市电子商务产业建设过程中存在的问题,形成一种有针对性的优化策略,期望以此来推进遂宁市电子商务产业发展的进程。  关键词:电子商务 产业发展 研究  一、遂宁市电商产业发展基本情况  1.政府方针政策方面。2016年6月23日,遂宁市市政府第六届59次常务会议研究通过《遂宁市2016年电子商务产业发展工作方案
期刊
摘 要:农田水利设施是农业发展的命脉,也是保障农村用水基本需求的关键。但是,当前我国乡村农田水利的建设和管理却存在很多的问题,在水利设施的投入、运行和维护等机制上都存在严重的弊端。本文试图从社会资本的研究视角来探讨当前中国乡村社会水利设施管理困境的现状、原因和影响,并试图为解决当前的困境提出治理措施,促进中国乡村社会的和谐建设和发展。  关键词:中国乡村 水利设施 社会资本  农村水利基础设施和农
期刊