论文部分内容阅读
基于质谱分析的蛋白质组学实验技术是目前广泛应用的蛋白质研究手段。该方法能够实现对复杂蛋白样品中的所有蛋白质进行自动化、高通量、高精度的检测。但由于该高通量方法产生的海量质谱图谱数据需要进一步的分析才能实现对样品中蛋白质的定性和定量研究。因此,针对质谱数据的生物信息学分析方法研究已成为关键。数据分析的新方法应用能够促进蛋白质的定性研究,包括对蛋白质翻译后修饰、变异或个体多态性蛋白产物、全新可变剪切蛋白产物以及全新蛋白质的鉴定等。另外,新方法的应用还能够提高质谱数据分析结果的可靠性,特别在定量蛋白质组学实验中,针对一个生物系统的几种状态下的蛋白表达差异的研究,能够获得更准确的蛋白定量结果。由此,针对蛋白质组学质谱数据分析中的这两大方面,本论文通过两个课题,研究开发了两种新方法,分别促进了质谱分析蛋白质组学的定性及定量研究。第一个课题中,针对全新可变剪切蛋白产物的鉴定,我们基于Ensembl数据库中人类基因组注释,构建了理论推测的全新外显子-外显子组合连接序列数据库。该数据库包含了所有相位兼容的全新外显子-外显子组合情况,并依据相应读码框将序列翻译成氨基酸序列进行储存。我们还将该数据库应用于一批肝组织培养分泌蛋白质组学质谱数据的分析中,通过X! Tandem和SEQUEST软件检索及高可信度结果筛选,我们共鉴定了非冗余的来自395个基因的488条横跨外显子-外显子连接处的肽段,可以直接说明相应全新外显子-外显子组合的存在,从而实现了全新可变剪切形式在蛋白质水平的鉴定。相比其他方法,该方法更全面考虑了外显子.外显子组合可能性,并且仅需检索外显子-外显子连接处肽段序列,能更有效迅速地鉴定全新可变剪切蛋白产物。第二个课题中,针对基于肽段水平定量的稳定同位素标记定量蛋白质组学质谱数据分析,我们基于小波理论提出了小波变换滤噪算法。该算法中,我们开发了全新的阈值滤波法以及空域自适应算法,能够更准确分辨噪音及优化信号,并整合Trans-Proteomic Pipeline (TPP)流水线分析软件发布了全新定量软件WaveletQuant.通过一批ICAT标记的酵母抽提蛋白标准比例样品的分析,该软件分析结果有力地说明了其算法能更有效地分辨出肽段离子单离子图谱中的真实信号,并且能更准确地选取对应肽段离子的峰信号区域,从而得出更正确的定量结果。通过这两个课题研究,我们开发并应用新方法对已有蛋白质组学质谱数据进行重新分析,获得了全新结果。这也深刻说明了生物信息学的方法研究对蛋白质组学研究的有力促进作用。