Glide打分函数中蛋白间打分噪音的发现和修正

来源 :浙江大学 | 被引量 : 0次 | 上传用户:Leechen17008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
极少小分子药物在与其靶点蛋白相互作用中具有足够的专一选择性。药物与非预期的非靶点蛋白结合常常导致副作用,但偶尔也引发一些新的治疗作用。因此,识别化合物的非靶点蛋白对于评价该化合物的研发潜力具有重要意义。在计算生物学中,反向对接的方法可以预测化合物的靶点蛋白。反向对接使用一个化合物(诱饵)对蛋白质库(猎物)进行虚拟筛选,这与正常对接过程中使用蛋白质(诱饵)对小分子库(猎物)进行筛选相反。本研究发现,在反向对接过程中对打分函数的针对性优化能够提高靶点蛋白预测的准确性。本研究选择的标准数据集Astex Diverse数据集是一个含有85个配体-受体蛋白复合物,且结构多样性的高质量数据集。对接软件Glide中的“标准精度”模式下的打分函数GlideScore,能够精确重复该数据集中58个配体小分子-受体蛋白复合物的晶体结合构象。但在针对这58个复合物的反向对接过程中,GlideScore只能够正确识别57%的配体小分子-受体蛋白关系。其原因可能是GlideScore对某些蛋白过高或者过低的打分,即GlideScore存在不同蛋白之间的噪音。分析成功和失败的反向对接例子发现,蛋白质特性“Balance"与反向对接的结果强烈相关。"Balance"为靶点蛋白结合位点的疏水性面积和亲水性面积之间的比值。通过引入一个以"Balance"为核心的修正项,能将小分子靶点蛋白的预测准确性提高27%(从57%提升至72%)。新的打分函数命名为BCGlideScore,它在另一个同质的额外测试集上也能以类似的幅度提高反向对接的准确率29%(从47%提升至60%)。分析发现,BCGlideScore的三个特性与提高反向对接准确率有关:加入的修正项能够减少“蛋白间”的噪音;加入修正项后的BCGlideScore与"Balance"之间的相关性减少;修正项可能代表了一个粗糙的蛋白质熵的变化的估计。“额外精度”模式为Glide中的另一个分子对接模式。该模式中的构象搜索算法和打分函数是为了更好的估计配体-受体蛋白亲和力而优化。使用与“标准精度”模式类似的分析流程发现,“额外精度”模式中获得最高反向对接准确率的打分函数XPEmodelScore同样存在“蛋白间”的噪音,但是由于候选小分子和蛋白特性种类和数量有限,没能成功发现与XPEmodelScore中“蛋白间”噪音强烈相关的特性,也就不能修正XPEmodelScore。我们提出相互作用的指纹描述有很大的潜能用来修正“蛋白间”噪音。另外,尽管显著提高打分函数与亲和力之间的相关性,能够提高化合物库筛选与蛋白质库筛选的准确性。但是,我们的结果显示XPGlideScore与亲和力的相关性稍高于标准模式下的GlideScore,但与GlideScore57%的反向对接准确率相比,XPGlideScore并不能很好的预测靶点(仅仅22%的正确率),这表示少量的提高打分函数与亲和力之间的相关性,未必能够转化成蛋白质库筛选准确性的提高。本研究还发现,分子对接中三个打分目标(预测最优结合构象、预测能够与受体蛋白结合的小分子和预测小分子靶点蛋白)分别侧重于配体-受体蛋白结合的不同方面。因此,为各自不同的目标开发专门的打分函数将会是可行和更加有效的。尽管能够满足所有目标的“全能”打分函数是存在的,但这种打分函数往往需要很大的计算量。而为不同的打分目的开发专门的功能,能够为每个专门的功能减少对精确度要求而减少计算量。同时,准备更全面,更有代表性的数据集来训练和测试更多专门的打分函数可能更加容易。因此,将打分目标分开可能是发展更加简单但更有效的打分系统的关键。这是目前首次对反向对接中打分函数的蛋白间噪音的报道和修正,我们希望本次研究能够引起对所有打分函数中类似蛋白间噪音的进一步研究和规范,最终能够使用反向对接更准确地预测小分子化合物的作用靶点。我们也将继续为发展针对反向对接的打分函数而继续努力。
其他文献
由于无线通信的广播特性,信号在传输的过程中容易被窃听。传统的基于密码学的高层加密技术需要用到各种密钥和复杂的算法,同时随着窃听者计算能力的发展容易被暴力破解,其保
艾滋病(AIDS)是一种由人类免疫缺陷病毒(HIV)引起的免疫和中枢神经系统的退行性疾病。HIV-1逆转录酶、蛋白酶和整合酶是HIV-1基因在复制过程中的3个关键酶,到目前为止抗HIV/A
<正>数形结合思想是初中数学重要的思想方法.所谓数形结合,就是把抽象的数学语言、数量关系与直观的几何图形、位置关系结合起来,根据数与形的对应关系、数与形的相互转
大环内酯类抗生素具有抗菌谱宽、临床服用方便、使用安全、毒副作用小等优点,多年来广泛应用于临床上治疗感染性疾病的治疗。细菌对大环内酯抗生素耐药的问题日益严重,尤其是
介绍了CPU自带模拟电位器用作设定定时器预置值的方法,结合其在胶囊充填机改造中的应用实例,说明灵活应用其可减少硬件、降低改造成本.
1临床资料患者,女,62岁。因"反复发作上腹部胀痛10 a,再发2周",于2010年5月30日入院。体检:体温36.8℃,脉搏89次.min-1,呼吸20次.min-1,血压155/98 mgHg(1 mmHg=0.133 kPa)。神志
目的:探讨树突状细胞(DC)和细胞因子诱导的杀伤细胞(CIK)为效应细胞的过继免疫联合化疗治疗初发多发性骨髓瘤(MM)的临床疗效及对患者外周血CD4~+CD25~+调节性T(Treg)细胞影响
本文讨论一万年以来的气候波动旋回及其时间序列,确定全新世冷暧时期。在综合各气候期划分方案的基础上,结合我国全新世气候变化事实,提出中国东部晚更新世—全新世气候期划
分布式电源在配电网的接入规模越来越大,但分布式电源出力的不确定性对配电网电压质量带来了严重影响。在对分布式光伏和分布式风电出力特性分析的基础上,建立了分布式电源接