串联质谱中肽碎片离子强度建模

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:Tianjun9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于串联质谱技术的蛋白质序列鉴定是蛋白质组学研究的基本方法。基于串联质谱技术的蛋白质序列鉴定的目标是根据实验质谱数据推断出未知肽段的氨基酸序列,其中肽的理论质谱预测是极其重要的部分。准确的理论质谱预测不仅可以促进蛋白质序列鉴定的发展,减少质谱数据的浪费,而且可以通过模型使我们更好地理解肽碎裂的规律,研究不同的理化特征对肽碎裂模式的影响,从而使我们更准确地模拟肽裂解的过程,提高肽序列鉴定的可信度。因此,设计一种更精确的理论质谱预测方法是非常必要的。本文提取肽的多种理化特征(质量、碱性、螺旋性、疏水性等)和序列特征(肽和碎片离子中氨基酸组成、肽C/N端氨基酸身份等),尝试利用深度信念网络和梯度提升决策树训练碎裂模型,以获得更准确的理论质谱预测效果。为此做了以下三部分工作:1)为选出使模型性能达到最好的特征集,分别使用深度信念网络和梯度提升决策树基于不同的特征集进行建模和性能测试。在一组表现最好的特征集上,深度信念网络和梯度提示决策树的预测性能分别获得0.826和0.877的皮尔森相关系数分值。2)使用梯度提升决策树对性能最好的特征集进行特征分析,获得不同特征对模型性能影响的重要性程度。结果表明:肽碎裂后右侧部分的质量与肽质量的比值、肽碎裂后右侧部分的碱性值、肽碎裂后右侧部分与肽的质荷比差值、肽碎裂后右侧部分的疏水性值是最重要的4个特征,且都与肽序列的C端有关。3)在两组公开数据集上的测试结果表明,本文两种方法的预测性能均优于现有的两种代表性方法MassAnalyzer和OpenMSSimulator。在本文构造的特征集上,相对于深度信念网络,梯度提升决策树表现更好。
其他文献
格子气自动机(Lattice Gas Automata)作为处理计算流体力学问题的一个重要工具,兴起于上世纪80年代,在其三十多年的发展历程中逐渐走向成熟,时至今日它依然在众多科学研究领
随着新课改的不断深入,“导学案”教学已经广泛应用于中学课堂教学之中,并且取得了一定成效,提高了学生的学习积极性,增强了学生的学习兴趣,同时自主学习与创新能力也得到了
内切-β-N-乙酰氨基葡糖苷酶(Endo-β-N-acetylglucosaminidases,ENGase)作为一种糖苷内切酶,可以水解N-糖蛋白中糖链上两个N-乙酰葡萄糖胺(N-acetylglucosamine,GlcNAc)之间
学校归属感是学生在校生活、学习以及社交的过程中,在行为上、情感上以及心理上对学校以及学校成员认可与融入的一种情感。数学的学习对于学生能力的培养有着重要的作用,并且
随着深度学习技术的成熟,人工智能正在逐步从尖端科技走向日常生活,因此对人工智能的进一步分析和发展技术——群体智能,开始被大量学者所关注研究,而群体智能中社会化行为的
截至目前,科学家们普遍认为夸克和轻子等组成了亚原子,而质子和中子等这些亚原子组成原子。一般情况下,由于夸克和胶子禁闭于强子中,我们无法观察到孤立的夸克和胶子。但是现
近几十年来,描述基本粒子相互作用和运动规律的粒子物理标准模型经受住了几乎所有高能物理实验的检验,被认为是非常成功的理论。它其中所包含的19个自由参数一旦被测定,所有
在中国北方地区考古发现战国至辽的高等级墓葬中,其中4处13座墓葬中有一种丧葬现象具有特殊性,即用金饰在墓主人的头部、上半身、下半身、足部,或者在墓主人的衣物上进行装饰
在应用科学和工程技术中,许多问题的研究最后都归结为求解一个或多个线性代数方程组.一般针对不同类型的线性方程组,采用不同的迭代方法求解.近年有学者指出,当线性方程组的
常型Sturm-Liouville系统的逆等值点问题主要研究由其特征函数的等值点唯一确定并重构该系统的问题.该问题的研究不仅在数学领域有着重要的意义,而且在物理、自然科学等领域