基于X射线自由电子激光散射图的蛋白质对接算法研究

来源 :中国工程物理研究院 | 被引量 : 0次 | 上传用户:qh12121312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的对接广泛存在于生命活动中,是十分重要的分子生物学问题。在细胞内,两个蛋白质分子要在拥挤的细胞环境中准确识别彼此,组装成复合大分子实现生物功能;在人体中,免疫系统可以通过配体受体相互结合识别外来蛋白质。研究蛋白质对接可以了解生物的化学过程,为研究新药提供理论依据。目前蛋白质对接问题正越来越多地受到人们关注。复合大分子的结构预测难以用传统实验方式解决:其分子量往往较大,难以通过NMR手段测得结构;大分子难以结晶,也难以运用X射线晶体学方法进行实验;对于复合蛋白,往往有一定的灵活度。目前,使用计算机模拟是预测蛋白质对接方式的主要途径。随着欧洲组织的CAPRI(相互作用预测竞赛)的开展,多种算法已经问世:如ZDOCK、Rosetta、等等。这些算法往往从物理相互作用,几何形状,基于经验的结合位点实验数据等出发,对新蛋白质结构进行预测、打分。其中,实验数据的引入会显著提升蛋白质对接算法的准确度,如SAXS-ATTRACT-DOCK,引入了小角散射的数据作为参考。X射线自由电子激光的问世使得我们有了新的方式解析蛋白质结构。它可以在常温不需要结晶的情况下对单个分子进行成像。单分子的取向未知,也可能在同一个实验中混合着同一个蛋白质的不同构象,实验获得的散射图一般信噪比较低。这些都为我们直接从散射图中获得结构信息带来了不少困难。在2014年对RNAi微海绵体取得了 17nm的2维分辨率,在2015年对病毒颗粒取得了 100nm的3维分辨率。但这个分辨率和传统的X射线晶体衍射和冷冻电镜单分子成像都相距甚远。我们提出一种基于原子建模和XFEL计算模拟的方法,研究蛋白质对接问题。由于目前实验方法的局限,还没有完整的单分子散射数据,因此我们利用计算模拟的方式进行方法研究。对于给定的蛋白质,我们由ZDOCK生成一组可能的预测结构,使用傅里叶变换的方法模拟出每个预测结构不同取向的散射图样,并和真实结构模拟出的XFEL结果进行对比。使用了基于像素间距离、径向函数、角度自相关函数打分函数对预测结构进行重新打分,找到和真实结构最接近的模型。我们得到的打分函数和预测结构相对真实结构的相似度有很高的相关性。我们进一步研究了不同打分函数的计算开销以及分子对称性对打分函数的影响。分析了分子取向未知的情况,考察了打分函数寻找实验分子真实取向的性能。此外,我们研究了多种分子构象混合在一起的情况,试图确认每一张散射图对应的分子构象。我们使用基于三种打分函数联合训练的k-近邻算法,只需要10000张散射图,我们就可以几乎完全分离出目标结构和与目标结构相差RMSD=0.61A的两种构象。这进一步说明了我们选择的打分函数具有高度的选择性,能够非常准确的描述蛋白质和蛋白质之间的相似度。基于这种方法,我们提出了一种迭代优化蛋白质结构分辨率的算法设想。最后,我们对算法进行了讨论。我们认为,基于分子建模及XFEL的算法对蛋白质对接问题性能良好,可以使用很少的散射图模拟得到令人满意的打分效果。可能会对未来解析复合大分子的XFEL数据有所帮助。
其他文献
白光LED凭借其在照明领域里独有的绝对优势和节能潜力,被认为是最具前景的白光光源。虽然目前LED已经实现了商品化,但是蓝光芯片复合黄色荧光粉所得的白光LED存在色温偏高,显
互补问题在科学研究和工程技术的许多领域有着广泛的应用,研究其理论与数值算法是当前计算数学与运筹学领域的热点问题.本文主要基于现有的研究成果,提出了三种新的基于模系
本论文对天然产物Hamigeran B进行了全合成研究,主要包括以下两部分内容:第一部分:天然产物Hamigeran B外消旋体的合成研究。Hamigeran B是一种具有高生物活性、对多种病毒细
随着大跨度钢结构理论基础与设计施工技术的不断发展,人们身边出现了越来越多采用大跨度钢结构的大型场馆,如体育馆、博物馆等,而这些场馆由于人群密集,往往是恐怖分子袭击的
荔枝是华南地区种植面积最大的热带亚热带水果,是华南农村重要的经济来源。华南荔枝园土壤pH较低,而西南四川泸州部分荔枝园土壤pH则为弱碱性。已知土壤pH对土壤理化性质和植
迄今为止,硅基复合材料因兼具无机物的稳定性及有机物的功能性而备受关注。在各种硅基复合材料的制备方法中,溶胶-凝胶法是其中应用最为广泛的一种。基于溶胶-凝胶过程,前驱
土地利用现状作为衡量每个城市的土地地类性质的数据,是一个数据量庞大且极其复杂的工作,如何提高土地利用数据统计工作的效率,保障数据的准确性,实效性,可行性,现势性,成为
二维材料具有新奇的电子性质,是近年来凝聚态物理的研究热点。2014年,二维黑磷(磷烯)在实验室中被机械剥离出来,同年,理论计算预言了二维蓝磷,2016年,二维蓝磷在实验室中被制备出来。2018年,二维黑砷(砷烯)在Si/Si02衬底上被制备出来。随着第V主族元素的二维层状材料逐渐变多,寻找V族元素的其他同素异形体结构在低维半导体器件领域有重要的意义。本文预言了一类Kagome结构的V族二维材料,研
资本结构是公司财务的一个重要问题,有关资本结构的研究最初主要关注资本结构与公司价值的关系,从而分析最优资本结构的确定以及影响最优资本结构的因素。大量研究发现最优资本结构不仅受到企业特征变量、财务弹性、股权结构等微观因素的影响,而且也受到宏观经济环境、制度因素等宏观因素的影响。这些不断变化的因素导致公司的实际资本结构和最优资本结构存在偏差,公司的资本结构是一个不断动态调整的过程,而这种调整过程又受多
甲基卡伟晶岩型稀有金属矿区位于青藏高原东部四川甘孜州,属高寒丘状高原地球化学景观区,是我国规模最大的固体锂矿富集区,形成了完整的Li-Be-Nb-Ta成矿系列。甲基卡矿区地表不同成因的第四系覆盖严重,常规的水系沉积物、土壤化探等勘探地球化学方法在一定程度上能够圈定找矿靶区,但却难以较精确地指示第四系覆盖物之下的隐伏矿体。植物地球化学测量法适用于多种景观条件找矿,故在甲基卡矿区开展植物地球化学找矿试