四维定量构效关系建模程序的设计与开发

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:bafjeght
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定量构效关系(Quantitative Structure-Activity Relationship,QSAR)已经成为药物研究者必不可少的一项工具。基于已知化合物的结构与活性数据构建的回归预测模型,可以预测未知化合物的活性,并指导药物分子的设计。本文采用Python语言,对QSAR的建模程序进行设计,以达到简化用户操作,既可以方便用户快速完成建模任务,也可以避免由于误操作产生错误的结果的目的。所得的QSAR建模程序,具有易于上手、自动高效、避免误操作和用户结果报告及相关图表可视化等特点,可以为药物设计研究者提高的工作效率,保障结果的准确性,为药物研发提供坚实的基础。基于LQTA-QSAR方法,设计编写了4D-QSAR程序QSAR-KING,以解决3D-QSAR中的构象对齐问题。使用动力学模拟产生化合物分子的构象集合文件,再进行描述符筛选和模型构建,以消除不同构象对模型的影响。QSAR-KING的程序设计与编写过程是程序运行环境设计、程序输入接口、GROMAC拓扑文件的生成、分子动力学模拟生成CEP文件、分子堆叠和描述符的生成;数据处理与建模包括经数据读取、截断与方差过滤、训练集与测试集划分、数据处理流水线、网格搜索确定超参数、描述符可视化和最终建模。所设计的QSAR-KING程序,简化用户操作,既可以方便用户快速完成建模任务,也可以避免由于误操作产生错误的结果。在使用者准备好文件后,该程序可完全自动化运行,运行结束后直接提供给用户结果报告及相关图表,还可以对三维空间中的描述符进行可视化。MIA-QSAR程序QSAR-QUEEN的设计编写是使用化合物的二维图片进行模型构建,通过读取每张化合物结构图片中的像素点值,建立一个高信噪比的2D-QSAR模型。QSAR-QUEEN的程序设计与编写过程包括:程序运行环境设计、程序输入接口和结构图片对齐,并自行设计使用图像矩阵最小均值误差算法自动对齐化合物结构图像;数据处理与建模包括数据读取与训练集测试集划分、描述符可视化和网格搜索与模型构建。QSAR-QUEEN程序设计的更为轻巧易用,可以在任何支持Python的操作系统(Windows、Linux、Mac OS)上快速自动构建模型。在程序运行结束后,提供报告与图表,所给出基团相关图,可指导药物研究者进行化合物结构设计及优化。在对数据集的实验过程中发现,将QSAR-QUEEN矩阵与QSAR-KING矩阵直接按列合并,生成新的大矩阵。对此数据矩阵,按照QSAR-KING的数据处理步骤进行操作,即由QSAR-ROYALTY程序执行,建立回归模型。QSAR-ROYALTY程序相当于将样本的描述符进行扩展,将以上两个程序生成的4D和MIA描述符还可以合并为一个矩阵,可以构建出一个超越两个单独模型性能的新模型。所设计的三款QSAR程序的运行性能的测试是选用Btk抑制剂药理活性数据集、ACh E抑制剂药理活性数据集以及GPb抑制剂药理活性数据集作为代表。QSAR-KING程序所得的QSAR模型在上述三个数据集上的表现优于QSAR-QUEEN的,这是由于数据集使用三维的静电场和立体场描述符可以更好的体现化合物之间的差异。但QSAR-QUEEN的优势在于,它几乎不产生任何额外的噪音信号,特别适用于某些数据集使用二维结构就能包含所有化合物之间差异的信息。QSAR-ROYALTY的QSAR模型预测效果明显优于单独使用QSAR-KING或QSAR-QUEEN模型的预测效果,因为它是从两者的全部信息中筛选出有价值的部分用于构建模型的。所的结果也验证了三款QSAR程序设计之初的目的。本文所设计的QSAR-QUEEN、QSAR-KING和QSAR-ROYALTY程序可以通过https://github.com/masgils下载,免费使用。
其他文献
没有执行力,就没有竞争力。在经济学家赵伟的观点当中,所有的竞争都来源于执行力,执行力的提高有助于解决竞争中所遇到的难题,而执行力通常会与管理的方式密切相关[1]。在当下经济发展较快的今天,中国已经与世界接轨,科技发展突飞猛进,从技术和企业的发展来看,在世界市场中受到内外两方的竞争压力。竞争的激烈性,使得企业需要提高自身的执行力,而员工执行力作为企业执行力中一重要环节,其有效的提升有助于企业改善在市
人体在行走过程中的身体姿态称为步态。正常步态具有稳定性、周期性和协调性等多项特性。在日常生产生活中,由于步态失稳而引起的滑摔事故频发,给世界各国造成巨大的经济损失和人员伤亡,受到高度重视。人体行走中脚底与地面构成一对摩擦副,脚与地面之间产生的间歇性相互作用称为步进摩擦。步进摩擦具有较为广阔的应用背景,如医学、军事、体育和制鞋领域等。目前,步进摩擦主要研究鞋底材料、路面材料及表面状态等单一因素对防滑
基于计划行为理论,从“知觉行为控制”、“行为态度”、“主观规范”三个方面研究影响农户成为职业粮农的主要因素,利用江西6个粮食主产县619个农户样本调查数据构建结构方程
虹膜识别(Iris Recognition)是一种安全性很高的生物特征识别技术。人眼虹膜区域稳定而丰富的纹理特征具备了生物特征识别技术所需要的普及性、排他性、稳定性和可获取性。相
随着计算机的普及和图像处理技术的不断发展,视频目标跟踪得到人们越来越多的关注,在交通管理、智能监控、人机交互和智慧城市等领域有着重要的应用意义。在图像处理、控制论
职业教育是我国推动经济产业升级、促进充分就业的重大战略。中国职业教育是世界上最大的职业教育体系,并随着深化改革迈入了高质量发展新时期。国家对职业教育的财政投入逐年增长,但专业布局重复、过度投入、软硬件实力不平衡等问题仍然存在,导致经费使用效益欠佳。选择符合职业教育发展趋势的公共项目绩效评价方法,并通过绩效评价促进职业教育服务能力提升、调整资金投入构成、改进实施流程、指导项目人员工作,可以指导行政决
唢呐,是一种双簧类气鸣乐器,这件古老的乐器在世界各地都有它的身影,在我国更是深受人民群众喜爱。它音色独特,受众于民间。自唢呐进入新疆地区以来,受本地区文化影响,经过融合和改制,其形制、音色等各方面逐渐发生了变化。唢呐的声学测量,主要运用测量系统对唢呐发声进行测量,针对其声学特性给予相对应的定量数据,根据最终得出数据对比分析并给出参考标准。而测量系统是为了得出最终测量数据的一个过程,这个过程包括:1
随着科技进步和经济发展,全球半导体产业沿着摩尔定律持续推进,不断刷新着物理极限,整体维持高速发展。进入2019年,逐步成熟的5G技术将加速人工智能、物联网、自动驾驶等行业的发展,为半导体产业发展提供更为广阔的应用前景;同时,国际贸易摩擦不断,作为高科技行业的半导体是贸易争端的主要行业之一,不可避免地受到了冲击。为了实现可持续发展,企业必须重新确定发展战略,以更好地适合其所面临的内外部环境。论文以K
全钒氧化还原液流电池(简称钒电池)是一种新型蓄电储能设备。正极电解液(VO2+/VO2+与硫酸的混合溶液)是钒电池的重要组成部分,对电池性能有直接影响。随着温度升高,正极电解液
神经胶质瘤简称胶质瘤,是最常见的原发性中枢神经系统肿瘤。目前主张综合疗法,以手术切除为主,术后配合放疗、化疗、免疫治疗及生物治疗等,通常可延缓肿瘤复发,延长病人生存