【摘 要】
:
从急剧膨胀的蛋白质序列数据信息中分析其结构和生物功能是后基因组时代面临的一个重要挑战。蛋白质结构类型能直观描述蛋白质的完整空间折叠结构模式,是解释蛋白质结构和功
论文部分内容阅读
从急剧膨胀的蛋白质序列数据信息中分析其结构和生物功能是后基因组时代面临的一个重要挑战。蛋白质结构类型能直观描述蛋白质的完整空间折叠结构模式,是解释蛋白质结构和功能的重要信息来源,为相关生物技术的发展提供了理论依据。然而确定蛋白质结构类型的传统生物实验方法不仅周期长而且成本高,所以利用数学方法和计算机技术开发快速有效的蛋白质结构类预测模型与实验方法互为补充将是一项非常有意义的工作。本文以蛋白质结构类预测为研究背景,基于统计模式识别的理论与方法,深入研究了蛋白质结构类预测中的特征表示问题,主要成果有:(1)本文提出了基于蛋白质二级结构信息的特征表示方法。该方法在预测的线性二级结构序列基础上,从二级结构含量、顺序和距离三个角度分别设计反映二级结构元素含量及其空间排列方式的特征,特别是大量与二级结构片段相关的距离特征。通过四个低序列相似性数据集上与其它基于二级结构的预测方法对比结果表明,这种基于二级结构含量、顺序和距离设计的特征表示方法更能有效地描述蛋白质二级结构的空间排布信息,其总体分类准确率以及α/β类和α+β类分类准确率有着不同程度的提高,是一种有效的特征表示方法。另外,为了研究蛋白质罕见二级结构对结构类预测性能的影响,设计了9个基于罕见二级结构的特征,实验结果说明罕见二级结构信息可以有效的改进蛋白质结构类预测模型的性能。(2)本文提出了基于蛋白质序列进化信息的特征表示方法。蛋白质进化信息反映了蛋白质序列中各个位置的氨基酸残基在进化过程中的保守性,这对揭示蛋白质的结构和功能有重要意义。从蛋白质氨基酸序列出发,由PSI-BLAST预测获取相应的位置特异性打分矩阵,设计了五种蛋白质氨基酸进化差异公式用于蛋白质序列特征表示。两个低序列相似性数据集上的预测结果显示了本文提出方法的有效性。此外,研究了基于二级结构和进化信息的多特征融合的蛋白质结构类预测方法,实验结果表明有效的特征融合确实可以显著改善原有基于单一信息来源的特征预测模型的分类准确率,这为基于多源信息特征融合来预测蛋白质结构类提供了新思路。
其他文献
目的探讨实时超声引导辅助疑难宫腔内操作手术的效果及临床应用价值。方法对共116例患者包括宫内节育器(IUD)取出困难、疑难高危人工流产术、宫腔胚物残留清宫术等进行实时超声
应急项目中资源的调度受到多种随机因素影响,处于复杂动态的环境中,求解困难;约束理论指出瓶颈是复杂系统管理的核心,将调度的重点放在瓶颈资源上可以简化复杂系统问题。针对
尼泊尔的教育始于语言教育:尼泊尔的语言教育就是从英语开始的。因此,尼泊尔的语言政策与外语教育密切相关。历史上,尼泊尔与印度以及英语国家接触最多,在交流上主要使用英语,因此英语对尼泊尔的影响最大。与中国也有一定的文化交流,但却远逊于英语。但是近年来中国经济的迅速发展使汉语在国际上、在中尼两国交往中的重要性日益突出,由此,中文教育在尼泊尔从无到有、从少到多,发生了巨大的变化,随之而来的是尼泊尔语言政策
目的:S1PR2(sphingosine 1-phosphate receptor 2)系七次跨膜G蛋白偶联受体家族成员之一,与其天然配体鞘氨醇-1-磷酸(sphingosine 1-phosphate,S1P)结合后介导跨膜信号传导,
专业课的“导论”是指大学专业课第一教学单元的教学内容。导论课教学要求教师确定专业课程的目标设置以及其在课程关系中的位置;促使学生感知课程的历史脉络、知识体系和逻辑
在现代平面设计中,留白提供了布局上的平衡,能衬托中心,给人们提供想象的空间。留白在设计中的应用,在赋予作品干净、整洁的视觉效果的同时,提升了作品意象的表达。文章结合
一、术前AFR和AGR对食管鳞癌患者根治术后的预后评估价值目的:系统性炎症反应在恶性肿瘤的发生发展过程中起着重要的作用,肿瘤患者低白蛋白血症不仅提示患者营养状况较差,而
3D打印技术是一项具有工业革命意义的新兴制造技术,随着3D打印技术的不断发展,高精度成为3D打印技术的一个重要发展方向,这就对电源供电的稳定性与可靠性提出了更高的要求。
Wernicke失语与传导性失语在失语症分类中均属流畅性失语,其鉴别对言语治疗及判定预后有重要的意义。笔者在工作中发现1例Wernicke失语患者恢复期表现出传导性失语的特点,以
本文根据通信信号调制识别过程中瞬时相位去线性的原理,提出了便于硬件实现的最小均方算法,实现了对瞬时相位解混叠后的线性相位分量的滤除。改进后的算法在不增加硬件资源的