论文部分内容阅读
选择性剪接(Alternative Splicing,AS)是指从一个mRNA前体中通过选择不同的剪接位点组合产生不同的mRNA转录本(isoform),其可能产生不同的蛋白产物,导致了基因蛋白产物的多样性。随着人类和模式生物基因组学研究的深入,发现70%以上的动物基因均能够产生两个以上的选择性剪接变体(alternative spliced isoforms),表明选择性剪接是一种重要的基因调控机制。随着高通量测序技术的快速进步,迄今已有130多个昆虫基因组发表,转录组拼接算法也在不断改进,能够从RNA-Seq数据中拼接出不同的选择性剪接变体。因此,从组学水平开展昆虫基因选择性剪接研究成为可能。本文构建和优化了昆虫选择性剪接的预测流程,对小菜蛾(Plutella xylostella)和腰带长体茧蜂(Macrocentruscingulum)的选择性剪接进行了预测和分析。研究结果如下:一、昆虫选择性剪接基因预测流程的构建及优化已发表的昆虫基因组大多为测序草图,RNA-Seq数据比较少。针对模式生物建立的选择性剪接预测流程不能直接应用于农业昆虫数据中。根据昆虫数据的特点构建和优化了选择性剪接分析流程,对不同的拼接参数进行比较优化,选出了最佳参数组合。该流程整合了 read前处理、选择性剪接基因的拼接、ORF预测筛选、拼接质量评估、基因注释、选择性剪接变体的表达量差异分析等多个过程。二、小菜蛾基因选择性剪接分析小菜蛾属鳞翅目菜蛾科,是世界性农业害虫,主要危害油菜、花椰菜和卷心菜等十字花科蔬菜,每年在全世界造成40-50亿美元的经济损失。目前,小菜蛾几乎对所有类型的杀虫剂都产生了抗性,增加了对其控制的难度。利用公开发表的小菜蛾转录组数据,包括卵、幼虫、蛹、成虫、毒死碑抗性幼虫、氟虫腈抗性幼虫、中肠和Bt毒素敏感系幼虫等8组RNA-Seq数据,预测得到10,701个选择性剪接基因,占多外显子基因的67.7%。特征分析发现,小菜蛾选择性剪接基因比非选择性剪接基因具有更长的转录本,CDS和3’-UTR。统计分析发现,小菜蛾有13类共323个抗药性相关基因,其中73%的基因具有选择性剪接。传统的差异表达分析在基因水平展开,一个基因的表达量综合了多个选择性剪接转录本的表达量总和。本研究在转录本水平开展了差异表达分析,发现17个抗药性相关转录本在敏感品系与毒死蜱抗性品系间、24个抗药性相关转录本在敏感品系与氟虫腈抗药性品系间的表达量有显著差异。结果表明,基因的选择性剪接可能与抗药性有关,转录本水平的差异表达分析更加准确和具有生物学意义。另外,发现79、98、26、85条转录本分别在卵、幼虫、蛹和成虫中特异性表达。用iPathCons进行信号通路注释,发现能够注释上信号通路的选择性剪接基因4,969个,非选择性剪接基因2,206个。其中,注释上氨代谢通路(Nitrogen metabolsm)中的19个基因中,有18个是选择性剪接基因。结果表明,小菜蛾基因中发生了大量的选择性剪接,是小菜蛾基因调控的重要机制之一,其可能参与抗药性的形成及幼虫发育调控。三、腰带长体茧蜂选择性剪接分析腰带长体茧蜂是膜翅目姬蜂总科茧蜂科的昆虫,专一性寄生亚洲玉米螟(Ostrinia furnacalis),具有多胚发育的特性,被大量用于玉米螟的生物防治。利用腰带长体茧蜂卵、幼虫、雄虫和雌虫转录组,预测得到4,580个选择性剪接基因,占所有多外显子基因的58.3%,其中近一半的选择性剪接基因只有两条转录本,这可能与腰带长体茧蜂转录组数据较少有关。基因特征分析发现,腰带长体茧蜂选择性剪接基因的转录本、CDS和3’-UTR长度比非选择性剪接基因更长,但两类基因的5’-UTR和外显子长度近似。选择性剪接基因的外显子个数较多,因此更容易产生选择性剪接事件。发现47个有显著差异表达的转录本,其中42条转录本在nr数据库中都能找到相似蛋白序列。结果表明,腰带长体茧蜂基因中发生了大量的选择性剪接事件。