基于GBM算法识别蛋白质中金属离子配体的结合残基

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:iPegatron
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命的物质基础,在不同的生命过程中实现了不同的特殊功能。然而,许多蛋白质功能的实现需要结合特定的配体,超过三分之一的蛋白质需要与金属离子配体结合,因此金属离子配体对蛋白质功能的实现起着重要作用,正确识别蛋白质中金属离子配体的结合残基对人体健康及分子药物设计有重要意义。通过实验识别金属离子配体的结合残基费时耗材,且不能批量处理数据,所以利用理论计算的方法准确识别蛋白质中金属离子配体的结合残基显得尤为重要。此外,不是所有的蛋白质都有三维结构信息,因此本文从蛋白质的序列信息出发,对金属离子配体的结合残基进行了统计分析和预测,主要工作如下:(1)以10种金属离子配体Zn2+、Cu2+、Fe2+、Fe3+、Co2+、Ca2+、Mg2+、Mn2+、Na+和K+的结合残基为研究对象,根据前人的研究及蛋白质的生物学背景知识,选取了氨基酸残基、亲疏水、极化电荷、预测的二级结构以及相对溶剂可及性信息作为特征参数,通过对相对溶剂可及性信息进行统计分析,将相对溶剂可及性进行了重新分类,得到了4种不同的分类(SA2、SAV、SAP、SA4)。(2)以位点氨基酸、位点亲疏水、位点电荷、位点二级结构和位点相对溶剂可及性保守信息为基础特征,利用位置权重矩阵分别得到了2L维特征参数;将相对溶剂可及性4种不同分类分别对应的5*2L维特征参数输入梯度提升算法(GBM)对10种金属离子配体结合残基进行识别,根据最优的预测结果,我们得到了10种金属离子配体相对应的相对溶剂可及性的最优分类;5交叉检验下得到的最优预测结果好于前人的预测结果,预测总精度(Acc)和马氏相关系数(MCC)均高于77.9%和0.558。而且以降维之后的特征子集为特征参数,也得到了好于前人的预测结果,说明构建的预测模型稳定性较好。为了检验预测模型的实用性,对金属离子配体的预测模型进行了独立检验,得到了较好的预测结果。实验结果说明本文构建的预测模型对金属离子配体结合残基有较好的识别能力。(3)利用离散增量算法和位置权重矩阵打分算法分别对氨基酸、亲疏水、极化电荷、二级结构和相对溶剂可及性的组分信息和位点保守信息进行降维处理,得到了20维组合信息。以组合信息为特征参数,基于算法参数优化设置的GBM算法,给出了10种金属离子配体分别对应的最优算法参数以及最优预测结果。同时计算了以5*2L维位点保守信息为特征参数,GBM在算法参数优化设置下10种金属离子配体结合残基的预测结果,预测结果进一步说明GBM中算法参数的优化设置是很重要的。
其他文献
<正>11.只有在大盘处于高位或调整态势之中,短线操作战术才是短线高手的首选。耐着性子等待时机出现,在时机出现时果断出击,是短线高手最重要的基本功。
期刊
前列腺增生肥大是老年男性的常见病和多发病。手术切除肥大的前列腺组织是主要治疗手段。这类患者多年老体弱,常合并有心肺脑等重要脏器病变,对麻醉和手术耐受力下降。经尿道
信息化给初中美术教学带来了挑战与机遇,在深化课改的背景下,初中美术教学创新要从教学方法、教学模式、教学设计等教学要素与环节中入手,通过信息化技术的运用与借鉴来推动
对石墨炉原子吸收光谱法测定稻谷中镉含量进行不确定度评价.稻谷镉含量不确定度的评估最终结果为:镉含量为0.18 mg/kg的样品中,扩展不确定度为0.0036 mg/kg.实验所引入的不确
作为设计师品牌,达衣岩进入北京市场已经7年之久,也培养了一大批喜欢这个品牌的“粉丝”,徐小姐就是其中之一。$$    近日,徐小姐在五道口等几家自己经常光顾的达衣岩专卖店
报纸
在中国经济快速发展的同时,人们的财富也快速增长,如何让资产保值增值成为人们亟待解决的问题。股票市场是继房地产之后另外一个重要的投资渠道。然而,虽然中国的资本市场经
针对GPS/BD射频接收机中镜像干扰信号难消除的问题,采用TSMC 0.18μm COMS工艺,设计了一款高镜像抑制比(IRR)、高转换增益、单边带噪声系数(NF)和线性度指标良好的镜像抑制混频器
《桥梁抗震与抗风》是土木工程专业一门理论性很强同时又紧密结合工程实践的课程。作者结合自身的教学工作,通过教学目标、教学现状、教学方法改进等方面对本课程的教学方法
主动脉夹层发病急,临床症状缺乏灵敏度,漏诊率和误诊率高,预后凶险,是主要的主动脉疾病致死原因。近年来我国主动脉夹层的发病比例有上升态势,但病理机制研究尚无明确结论,其
随着目前互联网技术以及自动驾驶技术的发展,车辆在车联网中的跟驰队列行驶已经成为未来的一种发展趋势。在队列行驶过程中,其气动特性将会发生改变,因此会影响跟驰行为中的各种参数。我国地域辽阔,地形复杂,车辆在高速公路上行驶也经常会受到侧风的影响,从而影响车辆行驶的稳定性。而在跟驰队列行驶的过程中,侧风同样会影响车群的气动特性参数。在目前描述跟驰行为的数学模型中,同样没有加入气动特性对跟驰模型的影响。因此