论文部分内容阅读
中华稻蝗(Oxya chinensis)是我国南北方水稻产区的主要害虫之一,主要咬食水稻叶片和谷粒,也危害小麦、玉米、豆类等禾本科植物。近年来,由于农业种植形式的调整,冬季气候变暖,以及生态环境变化等诸多因素的影响,中华稻蝗已经成为我国长江中下游水稻产区的主要农业害虫,对农业造成了巨大的经济损失。目前已经对中华稻蝗的生理生化、生活史、生态分布以及线粒体基因组等方面进行了研究,但还未见对中华稻蝗全基因组和转录组研究的报道。由于蝗虫的基因组大约有6500Mb,大约是人类基因组的2倍,是果蝇基因组的36倍多,因此对于科学研究并不是完全可用的。但是蝗虫转录组的数据量相对较小,并且通过高通量测序能够得到全基因组范围的基因表达与调控的有效信息。本实验通过Illumina公司的IIiScq2000高通量测序平台,对正常生理环境下的中华稻蝗若虫与成虫的转录组进行了深度测序,采用生物信息学方法分析大量的测序数据,发现了在若虫、成虫中差异表达的基因,对这种农业害虫的防治积累了丰富的数据信息。最后,通过对中华稻蝗线粒体转录组作图的研究,完善了之前应用生物信息学方法注释线粒体基因的不足。本研究中获得的主要结论如下:(1)构建了中华稻蝗若虫和成虫两个cDNA测序文库,利用HiSeq2000技术进行文库测序。每个样品获得4G的数据,若虫得到59,940,260条原始读序,成虫得到58,428,216条原始读序。由于中华稻蝗的全基因组还是未知的,因此对reads进行从头组装,获得若虫152,974个Contig,成虫134,352个Contig。进一步拼接得到若虫76,924个Unigene,成虫66,794个Unigene,若虫的Unigene比成虫多10,130条,说明若虫处于生长期,需要合成大量生长发育相关的蛋白质,因此若虫的基因转录水平明显高于成虫。将这两个样品的Unigene共同聚类拼接,最终得到68,166条中华稻蝗的Unigene,平均长度为599bp。(2)在这68,166条Unigene中,根据“基因结构相似,其功能同源”的原理,通过Blastx与各个蛋白质数据库进行比对,发现有27,933个Unigene注释到Nr、KEGG、COG、GO等数据库中,占中华稻蝗总Unigene数目的40%。在GO中,对被注释的6,439个具有同源性匹配的Unigene进行了3个类别的分类,参与生物学过程的基因最多,其中以细胞过程、代谢过程调控中参与的基因最多;而分子功能中,binding(各种连接形式)和activity(包括各种催化酶、转录调控因子、蛋白受体的活性)中注释的基因最多。(3) All-Unigene的KEGG Pathway分析中,有18,020个基因参与了242个代谢或信号通路,RNA运输途径中发现了12个与TAP(核RNA运输因子)相关的基因,一系列eIFs(转录起始因子)的相关基因。有91个Unigene注释到昆虫类的激素合成通路,其中包括保幼激素、蜕皮激素、类固醇激素、性信息素的相关基因,这些基因的发现为防治蝗虫的激素类农药研发奠定了充足的基础。(4)对若虫与成虫的转录组数据做RPKM标准化处理,发现68,166个Unigene中有65,535个表达水平有差异,其中有20,044个在成虫中表达上调的基因,45,491个在若虫中表达水平上调的基因。(5)利用对差异表达基因定义的标准(FDR<0.001并且差异倍数在2倍以上的基因),从65,535个表达水平有差异的基因中筛选出14,648个在若虫和成虫中显著性差异表达的基因。其中5,378个基因注释到GO分类中,2,575个参与生物学过程,1,700个参与细胞组分,1,103个注释到分子功能,注释到activity、regulation、 cell等功能中的基因最多。差异表达基因的KEGG Pathway分析显示,共有3,577个Unigene参与236个代谢或信号通路,参与生殖代谢通路、昆虫生理节律调控、核酸复制与转录、蛋白质翻译与加工修饰的相关基因都发生了不同程度的上调和下调,表明这些基因在中华稻蝗的生长发育、生理节律调控等方面发挥着重要作用。(6)利用线粒体转录组作图方法,分析了中华稻蝗的线粒体转录产物,发现若虫中两个rRNA基因比成虫的表达水平高,而rRNA基因的转录效率比蛋白质编码基因高。中华稻蝗线粒体基因组具有5个大的转录单位。ATP6/ATP8、ND4/ND4L这两对重叠基因在双顺反子上共同转录,这两个双顺反子的3’端是多聚腺苷酸化的。ND2、COX1、COX2、ATP6/ATP8、COX3、ND3、CYTB基因的覆盖度比较均匀且较高,应该是检测到的成熟转录本。而ND5、ND4、ND4L和ND1基因的部分区域没有覆盖到,由于这几个基因编码NADH脱氢酶的亚基,都位于轻链上是线粒体氧化磷酸化的关键酶,推测是测序时检测量较低或者是转录本的稳定性差异引起的。转录后基因表达调控在线粒体转录本后期的修饰中起着关键的作用,主要体现在蛋白质的丰度变化比mRNA的丰度高。