论文部分内容阅读
蛋白质是生命的物质基础,凡乎任何生物过程都与蛋白质发生某种联系。目前蛋白质序列数量的激增,急需要开发快速、准确的计算工具预测蛋白质的功能。因此,在蛋白质组学方面,生物信息学也得到很大发展,很多智能算法和服务器都已经得到开发和利用;然而在膜蛋白领域,由于其结构和定位的复杂性,对其功能和结构的研究仍是刚刚兴起。膜蛋白受体是一种特殊的跨膜蛋白,也是跨膜蛋白家族的最大类。作为外界信号的传输接受者和内在生物信号的传输者,具有重要的研究意义。本论文借助集成智能的方法,对膜蛋白受体的结构类、膜蛋白受体相互作用、膜蛋白受体与药物结合的网络以及与膜蛋白受体功能相关的凋谢蛋白亚细胞定位、膜蛋白受体信号传导决定的转录调节蛋白协同调控和网络等几个方面进行研究。主要归纳如下:
在膜蛋白受体结构类预测的研究中,以最典型的膜蛋白受体G蛋白偶联受体为例,利用蛋白质一阶签名模型构造了一个4200维向量,并基于离散二进制粒子群算法提取序列的特征;利用集成模糊K近邻分类器用于膜蛋白受体结构类的预测。训练集来自国际通用数据库GPCRDB。测试结果表明了本论文方法的可行性和实用性。最后构建了在线的Web服务器,可供生物学背景的研究者查询和使用。
在膜蛋白受体相互作用的研究中,以G蛋白偶联受体及其靶标蛋白G蛋白为样本,利用自适应免疫算法优化了集成分类器的权重,提出了改进型集成分类器LogitBoost,用于膜蛋白受体及其靶标膜蛋白偶联预测的研究。数据集来自国际通用数据库GRIFFN,测试结果论证了方法的可行性。
在膜蛋白受体与药物结合的网络的研究中,提出基于集成半监督学习方法的SemiBoost分类器,结合复杂网络特性对三种膜蛋白受体及细胞核受体与药物的相互作用网络的连接情况进行了预测和分析,并在国际通用的数据库KEGG和SuperTarget上进行了验证。
在膜蛋白受体功能相关的凋谢蛋白亚细胞定位中,集成氨基酸化学特性疏水和氨基酸序列的近似熵,构造了一个30维的改进型伪氨基酸向量模型,利用免疫遗传算法优化了该模型,提出了集成分类器AdaBoost用于预测膜蛋白受体重点参与的凋谢蛋白亚细胞定位的研究。实验结果也验证了方法的可行性。
在转录调节蛋白网络研究中,分析了由膜蛋白受体传递信号影响的转录调节蛋白的协同调控特性,提出了一种集成偏相关系数算法(PCIT)和调控影响参数(RIF)的蛋白质网络构建算法,并用于构建和优化转录调节蛋白网络;开发了一种协同调控模拟算法;利用网络集成熵和复杂网络理论分析了网络的特性,使用了澳大利亚联邦科工组织的牛骨骼肌转录蛋白质数据,尝试了在非模式生物上的研究,具有重大的生物意义。
最后,总结了全论文的研究内容,指出了研究中存在的不足,展望了下一步的研究方向。