蛋白基因组学中质谱分析方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zbgqx123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的顺利完成,利用蛋白基因组学研究生物体蛋白质已经成为在基因层面准确描述生物体基因组序列并确定其结构的重要手段之一。蛋白质作为基因的最终产物,是DNA、RNA层面遗传信息的直接体现,也是最可靠的判断依据。蛋白基因组学即结合基因组、转录组和蛋白质组数据,通过分析蛋白质氨基酸序列以确定基因组的结构和功能,并在基因组层面上进行表述。本文基于蛋白基因组学研究了在缺少物种参考蛋白质组情况下,如何分析质谱数据以准确识别蛋白质序列的方法。基于所研究方法,本文进一步研究了如何通过不同组学的测序数据,构建样本特定蛋白质肽段序列,从而提高质谱数据对生物体蛋白序列的识别能力。Bottom-up和top-down作为两种主要的质谱检测技术,为生物体蛋白质的鉴定提供了大量的数据。两种技术相结合不但可以准确识别和鉴定生物体蛋白质,发现组织中所有表达的蛋白质序列,同时可以发现物种在蛋白质层面的氨基酸变异和后期转录修饰等,为深入研究基因的结构和功能提供了基础。因此,本文针对蛋白基因组学中质谱识别的问题,开展了以下几方面的研究:(1)提出了一种针对top-down质谱数据的同源蛋白质识别和序列分析方法。在缺少参考蛋白质组的情况下,top-down质谱无法有效识别被检测蛋白质。针对这一问题,本文利用同源蛋白质组代替参考蛋白质组,通过top-down质谱动态规划比对方法,识别了蛋白肽段序列和对应蛋白质。在此基础上,本文进一步设计了一种基于序列相似性的序列比对方法,该方法不但可用于判断被top-down质谱识别到的同源蛋白质或蛋白质变体,而且可用于确定同源序列中的氨基酸变异位置。(2)提出了一种考虑氨基酸变异的蛋白质肽段序列重构方法。样本特定的氨基酸变异使得质谱对参考蛋白质序列的识别敏感度降低。本文利用RNA-seq测序数据和基因组注释信息,重组了样本转录本序列并推测了重组转录本的特定阅读框,进而构建了具有样本特定变异的氨基酸序列,并从中提取了样本特异性肽段序列。相比于参考蛋白组序列,基于重组和注释方法构建的特异性肽段序列与样本真实序列更为接近,从而提高了质谱识别的敏感度。(3)根据物种基因组注释是否已知,提出了一种通过选取适合策略来生成具有样本特定变异肽段序列集的方法。基于RNA-seq测序数据,不同策略可以构建不同的样本肽段序列集,然而质谱对这些肽段序列集的识别敏感度还尚待分析。本文基于RNA-seq测序数据,分别利用不同策略构建了多个样本特异性肽段序列集。Top-down和bottom-up质谱分别搜索这些序列集,并获取相应的谱肽匹配,进而从质谱识别敏感度、氨基酸变异识别和蛋白质变体识别等方面,分析了不同策略的特点和优势,并得到了针对不同实验目的和实验条件来选取适合策略构建具有特定变异肽段序列数据集的方法。利用该方法在很大程度上节约了时间成本,解决了由于肽段序列获取方法不当而导致的质谱识别敏感度低的问题,提高了样本特异性蛋白序列的识别敏感度。(4)提出了一种基于质谱的选择性剪接中跳跃外显子的识别方法。主要用于在蛋白层面对生物体选择性剪接状态进行进一步的描述。本文基于RNA-seq测序数据和基因组注释信息构建了具有特定长度的剪接肽段序列数据库,并利用bottom-up质谱搜索该序列数据库,通过谱肽匹配中肽段序列,识别出选择性剪接中的跳跃外显子。结合基因组学中PSI的概念,本文进一步提出了在蛋白层面验证选择性剪接中跳跃外显子表达的方法,实现了在蛋白层面对选择性剪接的分析和描述。
其他文献
当前,减排CO2的呼声日益高涨。在未来相当长的时间内,我国一次能源仍将以煤为主,而用于发电的煤炭量占到煤炭消费总量的一半以上,已成为国内CO2排放的重要来源。整体煤气化联
由于现有金融企业的管理水平以及工资发放规范等原因,使得密薪制这种工资发放制度暴露出诸多弊端。不少金融企业打着"密薪制"的旗号,为工资的暗箱操作做铺垫,在"密薪制"薪酬体系
WiFi无线技术应用极为广泛,是办公室、餐厅、酒店、商场等公众场合的必备。企业和家庭用户设立了大量的无线热点,增加了WiFi热点管理的难度。该文使用树莓派和esp8266单片机,
稀土饲料添加剂能提高动物的生产性能。本文就稀土饲料添加剂的促生长作用机理、安全性、在动物生产中的应用效果、应用技术及存在问题作一综述。
通过对云南220kV新平变电所接地电阻允许值的计算分析,讨论安全、可靠、经济、合理的变电所接地设计方法,以保证接地电阻满足规定要求。