论文部分内容阅读
血管紧张素转换酶(ACE)在人体血压调节系统中起着至关重要的作用。它具有催化无活性的血管紧张素I转化为有升压效应的血管紧张素II及可以使降压缓激肽失活的双重特性。目前,临床治疗高血压的方法基本是寻找合适的酶抑制剂,抑制剂与酶结合发挥生物效应,从而对心脏、肾脏、脑等器官起到保护作用,降低心血管疾病的发病率及死亡率。因此,血管紧张素转换酶抑制剂的预测及筛选成为了治疗高血压疾病的一大热点问题。论文以ACE为研究对象,采用定量构效关系(QSAR)、分子对接等计算生物学相关的理论方法,对ACE抑制剂进行分类预测及作用机理的探索,并作出了理论分析。论文主要研究内容及结果如下:(1)基于Binding数据库筛选了554个ACE抑制剂底物分子,根据实验检测数据结果进行划分,并利用vsurf_描述符对分子结构进行表征,结合支持向量机(SVM)建立了仅包含3个二维描述子的QSAR分类模型;同时又构建了含有4个三维描述子的QSAR模型,且模型均具有简单、高效、预测性能高的优点。研究结果显示:训练集444个样本采用二维描述子建立的模型预测准确度(Accuracy,Acc),灵敏度(Sensitivity,Sen),特异度(Specificity,Sep),受试者操作特征曲线下面积(Area Under Receiver Operating Characteristics Curve,AUC),马修斯相关系数(Matthew’s Coefficient of Correlation,MCC)的结果分别为89.637%,91.185%,82.716%,0.938,0.686;测试集110个样本的预测结果分别为81.818%,84.337%,74.074%,0.909,0.549。此外,论文还基于文献收集了114个抑制剂分子作为外部预测集,其预测结果Acc,Sen及AUC为67.544%,70.526%,0.572。444个训练集样本的三维描述子模型结果Acc,Sen,Sep,AUC,MCC分别为88.739%,90.91%,80.43%,0.914,0.678;预测测试集110个样本的结果为86.364%,87.10%,82.35%,0.909,0.591;同时114个外部预测样本的结果Acc,Sen及AUC分别为71.93%,94%,0.809。(2)应用本实验室研究开发的氨基酸广义信息因子分析标度(FASGAI)、天然和非天然氨基酸指数表征参数(NNAAIndex),这两种氨基酸描述子对数据库(BIOPEP)中ACE抑制剂寡肽(二肽、三肽)进行结构表征。利用两种描述子的表征信息结合SVM分别对二肽、三肽建立最优的分类模型。对比两种不同描述符变量建立的模型结果,FASGAI描述符建立的模型结果更加优秀。二肽训练集78个样本采用FASGAI描述子得到仅包含2个变量参数的QSAR模型,Acc,Sen,Sep,AUC,MCC分别为82.051%,79.167%,83.333%,0.903,0.601;测试集20个样本的预测结果分别为90%,77.778%,100%,0.956,0.811。三肽训练集106个样本与测试集26个样本采用FASGAI结构表征建立的包含3个描述子的预测模型,其Acc,Sen,Sep,AUC分别为79.245%,77.907%,85%,0.846;76.923%,81.818%,50%,0.658。(3)554个底物抑制剂分子、98条二肽、132条三肽分别采用分子对接方法进行配体与受体结合,并联合使用SVM预测模型参数及分子对接打分函数得到的打分值建立新的预测模型,进一步巩固并解释SVM模型的可靠性及稳定性。分析对接结果中最优结合构象的特征,得出小分子抑制剂的氢键;二肽抑制剂C端的芳香族氨基酸;三肽抑制剂N端氨基酸的疏水性、α-螺旋与转角倾向,中间位点氨基酸残基的静电性,对酶的抑制效果均有显著影响。这些结论为药物抑制剂的分子设计奠定了理论基础。