蛋白质结构预测中若干问题的研究

被引量 : 0次 | 上传用户:tobydu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为遗传信息的表现者,蛋白质是细胞中最丰富、功能最多的生物大分子。研究发现蛋白质功能与蛋白质的空间结构有着紧密联系,具有相似功能的蛋白质其结构往往比较相似。所以,对蛋白质结构进行预测研究可以了解蛋白质的功能,进而有助于揭示生命活动的本质,且对相关疾病发生机制的认识及有针对性药物的研发会起到积极的推动作用。随着高通量测序技术的不断发展,蛋白质序列的数目在呈指数形式增加,使用实验方法去获取蛋白质的结构已经远不能满足需要。因而,利用计算方法来进行蛋白质结构预测已成为生物信息学研究中的一大热点。本文主要研究了蛋白质结构预测中两个重要的问题:基于关联图的蛋白质结构重建和二硫键连接模式预测。提出了基于2D关联图的蛋白质3D重建算法Glocal。Glocal算法中使用粒子群算法去优化全局能量函数,利用模拟退火算法去优化局部能量函数。通过引入粒子群算法,避免了的之前重建算法中广泛存在的关于初始结构选择这一难题。通过设计全局函数,从整个关联图的角度去优化蛋白质的初始结构,可以有效的减少陷入局部最优,提高了预测精度。大量实验证明,Glocal算法有效的从天然关联图中恢复的蛋白质3D结构,重建蛋白质结构的平均RMSD值小于2。同时,Glocal算法在处理含有错误连接的关联图显示了良好的健壮性。实验中,进一步分析关联图中长连接和阈值对蛋白质重建结果的影响。提出了融合了传统机器学习模型和突变关联预测模型的二硫键连接模式预测模型。在传统机器学习模型部分中,引入了结构域特征,采用并联方式融合两个半胱氨酸的特征并进一步采用广义主成分分析(GPCA)降维。通过大量的实验论证了这些改进可以有效的提高预测模型的预测精度。二硫键作为蛋白质中一种重要的连接,形成二硫键的两个半胱氨酸位置之间可能存在共同进化,因而可以利用突变关联方法去预测二硫键。文中分析了传统机器学习模型和突变关联预测模型在二硫键连接模式预测上优缺点,并使用线性方式去融合这两个模型的预测结果,形成了最终的二硫键连接模式预测模型。本文中的预测模型的最终预测精度为Q_C=81.8%和Q_P=79.2%,充分验证了该模型的有效性。
其他文献
蓝相是一种介于液晶各向同性相和向列相之间的相态,蓝相的名字来源于其在偏光显微镜下呈现的蓝色布拉格反射块状纹理。相比于传统的液晶,蓝相液晶具有一些革命性的优点:无驱动电
将爆破地震波进行合理近似简化,采用波函数展开法,推导出无限岩石介质中爆破地震波作用下隧道围岩和衬砌动应力集中系数的表达式。结合具体算例,分析隧道不同位置上爆破地震
为研究上部采用锚索框架结构、下部设置为桩板墙的组合式支挡结构的抗震性能,开展了大型振动台模型试验。通过输入不同强度大瑞波测试了组合结构的加速度响应和动土压力响应,
本文明确了加工贸易及其保税核查的相关概念以及特点,并从加工贸易对经济的重要性、海关进出口量不断扩大和监管关员日益紧缺的矛盾以及海关总署提出“大监管”体系建设三方面
正交频分复用(OFDM)技术由于具有利用频谱的效率高,可采用的调制格式灵活以及信道均衡简单容易实现等优势,在无线通信领域已经成为一项日益成熟的技术。近年来,将该技术应用到光通
柱状节理岩体由于其内部赋存大量的隐节理面,开挖卸荷后极易出现隐节理面开裂松弛等特征,导致其破坏模式异于一般岩体。其破坏模式主要受到异常发育的节理面和较高地应力的共
<正> 多功能太阳电池电性能测试系统,采用大功率冷光灯做模拟太阳光源,对主机及样品架采取了有效的温控措施,并使用单板微处理机对测试结果进行联机实时处理,测试准确、快速
随着城市化快速的发展进程和城市土地资源的约束,社区规划的秩序性趋向导致了高层密集型公寓的模式化以及社区交往空间用地的形式化;但是,随着社会的进步,居民生活水平的提高,社区
采用共沉淀法制备了不同铈锆比的ZrxCe1-xO2(x=0,0.1,0.3,0.5,0.7,0.9,1.0)固溶体.利用热分析方法研究了Zrx(OH)4x.Ce1-x(OH)4(1-x)体系的热分解过程,并运用XRD对其热分解产
随着数字视频技术日益广泛的应用,视频成为信息记录和取证的重要媒介,其内容的合法性认证成为亟待解决的热点问题。合法性认证问题主要包括两方面内容。一方面,视频的所有者的身