论文部分内容阅读
继人类基因组计划在本世纪初落下帷幕以后,生命科学研究已跨入了后基因组时代,揭示蛋白质结构功能关系和相互作用规律成为新时期的科学主题。广泛深入的学科领域交叉蓬勃发展,已成为后基因组时代生命科学发展的内在要求和发展动力。特别是计算机科学迅速发展,实现了对海量数据存储分析,为生命科学研究注入了前所未有的活力。在当今生物功能复合体的结构功能关系迫切需要了解认识的情况下,计算方法在生物大分子复合物结构预测和相互识别机制研究领域将大有作为。尽管结构生物学实验手段不断迅速发展,但是在解析生物大分子组装体结构方面仍然存在技术瓶颈。计算方法在总结现有生物分子结构特征的基础上,利用物理化学基本原理,进行蛋白质与配体复合物结构预测和相互作用规律研究,将成为实验手段的重要补充,并在某种程度上对实验工作有重要的指导意义。
在众多预测复合物结构的理论方法中,分子对接方法备受重视。构象空间搜索和打分函数筛选最佳结合模式是分子对接算法的两个重要组成部分。特别是打分函数的准确性直接决定着结构预测的成功率。因此,打分函数研究已成为当前分子对接算法研究的热点和难点之一。传统的打分函数试图寻找适于全部蛋白复合物的统一规律。然而,生物体内的大分子复合物结构不同,功能各异,为了适应其各自的功能特点和进化趋势,在不同类型复合物的分子特征与相互识别规律上必然存在一定差别。
因此,本论文在不同类型蛋白质复合物结合界面的物理化学特征不同的基础上,针对Enzyme/inhibitor,Antigen/antibody以外的Other类型复合物,设计出特异性打分函数,用于在对接过程中挑选有效结构。Other类型复合物在生物体内的信号传导途径、代谢调控、协同作用效应等重大生理过程中起着重要作用,而且理论预测和实验解析都存在许多困难,有着重大的理论研究意义和实际应用价值。Other类型打分函数由原子接触能(EACE)、范德华和静电相互作用能组成,通过多元线性回归方法获得各项的权重系数。对CAPRIbenchmark1数据集中17个Other类型蛋白复合物的对接结构测试结果表明,组合打分函数ComScore1的预测成功率明显高于残基成对势(RP)。-Ⅰ-对CAPRI第8轮的两个结构分别用组合打分ComScore1与RP进行筛选,结果显示:组合打分ComScore1捕获的有效结构数目明显多于RP,而且排序先于RP,并能够囊括RP搜寻得到的有效结构。在CAPRI第9轮,对组合打分训练集进行了优选,发展出组合打分ComScore2。通过benchmark1测试,ComScore2显示出较ComScore1更强预测能力。从对Target25打分预测结果上看,组合打分ComScore2分别捕获到可接受预测和中等预测模型中L_rmsd最小者,并且在所提交的全部10个模型中,有6个评价为可接受预测或中等预测,其综合表现位居本次打分预测之首。
可见,本论文发展的组合打分函数ComScore1和ComScore2,基本能够体现Other类复合物的物理化学特征,反映出复合物形成前后的能量变化关系,具备一定的从大量采集构象中筛选获得有效结构的能力,适用于对Other类型复合的对接构象进行打分排序。组合打分将蛋白质分类思想引入打分函数设计,旨在突出分子识别过程中基于复合物类型的物理化学特征,重在实用性与高效性,并得到实践验证,为今后分子对接领域打分函数发展提了供借鉴。