三维氨基酸描述子在肽类定量构效关系研究中的应用

来源 :山西大学 | 被引量 : 3次 | 上传用户:dxc1989120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,定量构效关系(Quantitative Structure Activity Relationship, QSAR)作为一种间接方法,在计算机辅助药物分子设计中得到了广泛的应用,并已经成为一种不可或缺的工具。进行QSAR研究的关键前提和重要组成部分是分子结构参数化。众所周知,氨基酸的序列中隐藏着肽和蛋白质的功能信息及空间结构。因此,氨基酸的结构信息对肽的QSAR研究至关重要。此外,由于三维(Three dimension,3D)描述子能够直接反映受体和底物在分子作用过程中的非键合相互作用特征,因此据此所建的定量构效模型在物化意义上更为明确。本文将三种从生物分子的最基本结构特征出发,并综合立体、电子、疏水效应和分子整体三维结构信息,以及内部原子之间相互作用和外部分子影响的三维氨基酸描述子,引入几种肽类药物的结构与生物活性的QSAR模型,为将来此类药物分子的功能预测提供了理论指导。此外,文中将全部样本划分为训练集和测试集两个部分,由训练集样本建立QSAR模型,采用留一法(leave one out, LOO)内部验证对模型进行质量评价,并使用多种评价函数,对模型的外部预测能力进行了评价,确保了模型的真实有效性。本文开展的具体工作有:(1)将从20种天然氨基酸三维信息中提取出的721个描述子变量经过主成分分析(principal component analysis, PCA)而得到的三维氨基酸描述子-SVTD(Scores Vector of Three Dimension Descriptors),应用于21个后叶催产素及65个HLA(human leukocyte antigen)-A*0201限制性CTL(cytotoxic T lymphocyte)表位肽样本的定量构效研究中,取得了理想的结果。使用多元线性回归(multiple linear regression, MLR)建模,同时采用内部和外部双重验证的办法对所建模型的稳定性进行深入分析和检验。对于后叶催产素样本,所得模型的相关系数(Rum)、留一法交互校验(Cross-validation, CV)相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.981,0.962,0.966。对于HLA-A*0201限制性CTL表位肽样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.949,0.899,0.922。结果表明SVTD描述子能很好地表征肽类分子的结构信息,所建模型具有很好的拟合能力和预测能力,为该类药物的开发提供了理论指导。(2)将从20种天然氨基酸的空间构型中得到的WHIM(weighted holistic invariant molecular)描述子进行主成分分析得到的权重整体不变分子指数主成分得分矢量VSW (vector of principal component scores for weighted holistic invariant molecular index),应用于152个HLA-A*0201限制性CTL表位肽以及101个阳离子抗菌肽样本的定量构效关系研究中。对于HLA-A*0201限制性CTL表位肽样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.806,0.756,0.693。对于抗菌肽样本,所得模型的相关系数(Rcum)、留法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.869,0.834,0.702。结果表明VSW描述子可用于肽类药物的活性预测和新型药物的分子设计。(3)将从天然氨基酸中得到的23种电子作用力,37种空间作用力,54种疏水作用力和5种氢键作用力进行主成分分析得到的分离物化性质得分DPPS(divided physicochemical property scores),应用于58个血管紧张素转化酶抑制剂和25个HLA-Cw*0102表位肽的定量构效研究中。对于血管紧张素转化酶抑制剂样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.943,0.909,0.916。对于HLA-Cw*0102表位肽样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)分别为0.868,0.795。结果表明DPPS描述子因其明确的物化含义,可以用于定量构效关系模型的解释,因而可用来指导新型高活性分子的设计。
其他文献
人力资源开发对于我国经济社会发展具有重要意义。当前,我国人力资源开发既面临重大机遇,也面临重大挑战。其中,我国人力资源开发的机遇,主要包括:逐步重视人才开发,为人力资
综合分析影响地面气象观测数据文件质量的因素,阐述地面气象观测数据文件审核中疑误信息处理方式,针对地面气象观测数据文件质量控制提出建议。
榆林自古就是游牧与农耕文化交融的地区,特殊的地理位置和环境孕育了独特的饮食文化。饮食文化资源的旅游开发有利于游客领略地方传统文化,因而应加强饮食文化资源的挖掘,打
<正>本节课为"2016年春浙师尖峰教育论坛(浙江省高中地理名师网络工作室教学展示专场)"展示的课例。【教学构思】本课是以法国罗纳河流域为区域背景的高三二轮复习课,复习的
合成类高分子材料已经成为人们日常生活中不可缺少的一部分,尤其是可生物降解脂肪族聚酯,如聚乳交酯、聚己内酯及其共聚物,因具有良好的生物相容性、生物可降解性和渗透性已
市场经济发展变化莫测,尤其是我国在打开国门以后,国家经济发展飞速,这对于制造业大国来说,企业的市场经济竞争压力很大。制造业企业需要在行业竞争和市场环境中稳步发展,就
针对目前人工利用LKJ数据进行机车速度传感器故障诊断存在诊断效率低、诊断时间较长、对数据分析人员经验依赖程度高的缺点,将加权K近邻分类器引入基于LKJ数据的速度传感器故
在举国庆祝新中国成立70周年之际,中国工程建设标准化协会也喜迎40华诞。近日,住房城乡建设部副部长易军发来贺信,祝贺中国工程建设标准化协会成立40周年,并向全国工程建设标
目前新生儿PICC尖端定位的方法主要有体表测量法、X线尖端定位法、B超引导辅助定位和静脉腔内心电图定位。前3种方法分别存在局限性:个体生理结构的差异可能会影响体表测量结
<正> 曲阜孔庙音乐是祭祀孔子仪式中的专用音乐。旧时,每年春秋二仲(二月、八月)的头一个丁日(俗称“上丁”)及孔子生日,均要在孔庙举行祭祀大典,故孔庙音乐也有“丁祭音乐”