论文部分内容阅读
颈双缘姬蜂Diadromus collaris (Gravenhorst)(Hymenoptera:Ichneumonidae)和菜蛾盘绒茧蜂Cotesia vestalis (Haliday)(Hymenoptera:Braconidae)是十字花科世界性害虫小菜蛾Plutella xylostella (L.)(Lepidoptera:Plutellidae)的两种重要寄生蜂,分别主要寄生小菜蛾的蛹和幼虫,在世界上很多地方都有分布,其毒液是成功寄生的关键因子之一。本文对两种内寄生蜂的毒腺转录组进行了测序、分析和研究。在此基础上,运用蛋白质组学及比较转录组学的方法又进一步分别研究了两种蜂的毒液分子特性,并对其中的部分毒液基因进行了克隆及原核表达。两种寄生蜂毒腺转录组的测序和分析本研究使用Illumina测序技术,对小菜蛾两种重要寄生蜂-颈双缘姬蜂和菜蛾盘绒茧蜂的毒腺转录组进行了测序和分析,在两个毒腺转录组中分别获得了38,823和31,146个unigenes,这--unigenes数量要比目前已知的其它所有寄生蜂毒腺或毒液基因的总和还要多,为进一步研究这两种寄生蜂毒腺及其与寄主的互作提供了大量的基因资源。使用NCBI的nr数据库,我们分别注释了颈双缘姬蜂和菜蛾盘绒茧蜂两个毒腺转录组的19,147(49%)和18,569(59%)个unigenes,长度较长的unigenes在nr数据库中有匹配序列的比例较高。两个转录组数据的注释结果中,都是与印度跳蚁Harpegnathos saltator的基因匹配比例最高(比例分别占到颈双缘姬蜂和菜蛾盘绒茧蜂毒腺转录组的28%和25%),其次是佛罗里达弓背蚁Camponotus floridanus(25%和24%)和切叶蚁Acromyrmex echinatior(24%和22%)。颈双缘姬蜂和菜蛾盘绒茧蜂毒腺转录组分别有7874(20%)和6742(21%)个unigenes注释到GO分类系统。在GO分类系统的二级水平上,“结合(binding)"包含的unigenes数量在两个转录组中均为最多。两转录组在3个大类,即“细胞组分(cellular component)"、"分子功能(molecular function)”和“生物过程(biological process)"中,“细胞(cell)"“细胞过程(cellular process)"和“结合”分别是包含unigenes数量最高的。两个转录组unigenes的GO注释所包含unigenes数量比例分布模式在GO系统的二、三、四和五级水平上均有显著的相似性。无论是整体上还是在每个大类中,Pearson相关系数都>0.99且P-value<<0.01,这可能意味着两毒腺转录组有着显著相似的功能谱或模式。颈双缘姬蜂和菜蛾盘绒茧蜂毒腺转录组分别有12033和11616个unigenes比对到231和230个KEGG信号通路,其中绝大多数通路为两者所共有(230个),只有通路‘’asthma"为颈双缘姬蜂毒腺转录组所特有。含注释unigenes数量最多的20个通路中,有18个为二者所共有。注释unigene最多的通路都是“代谢通路(metabolic pathways)"、“剪切体(spliceosome)"和"RNA转运(RNA transport)"。通过分泌蛋白预测、毒液同源蛋白比对及利用RPKM值筛选高表达基因的手段,我们在颈双缘姬蜂和菜蛾盘绒茧蜂毒腺转录组分别预测了1374和1092个潜在毒液蛋白基因。与已知膜翅目毒液蛋白数据库比对后,在颈双缘姬蜂和菜蛾盘绒茧蜂毒腺转录组中分别比对到852和495个已知膜翅目毒液蛋白的同源蛋白,其中包括动物毒液中广泛存在的毒液蛋白,如酸性磷酸酶(icid phosphatase)、金属蛋白酶(metalloprotease)丝氨酸蛋白酶(serine protease)、毒液抗原5(venom antigen5)和透明质酸酶(hyaluronidase)等的同源蛋白编码序列。生物信息学软件预测发现,在颈双缘姬蜂和菜蛾盘绒茧蜂毒腺转录组分别存在317和233个unigenes编码分泌蛋白,但大多数与已知毒液蛋白无匹配,可能是全新的毒液蛋白。在高表达量(RPKM>100)的基因中,我们也发现了很多潜在的毒液蛋白基因,其中既有已知毒液蛋白的同源蛋白基因,也包含了预测的分泌蛋白编码基因。上述研究是第一次使用Illumina测序技术对节肢动物毒腺转录组进行测序,结果表明Illumina测序及相应的拼接注释技术是适合于缺乏基因组数据的蜂类毒腺转录组研究的。我们的工作为研究两种寄生蜂调控寄主小菜蛾机制特别是毒液如何调控寄主的研究提供了大量的基因信息,为下一步的研究奠定了基础。部分毒液基因的克隆及原核表达利用RACE技术得到了两个毒腺转录组中几个毒液基因的全长。在颈双缘姬蜂和菜蛾盘绒茧蜂毒腺转录组分析中所获得的透明质酸酶和毒液抗原5两种毒液蛋白同源基因片段基础上,克隆到了其编码cDNA的全长序列,并利用原核表达技术表达了两种毒液的类抗原5蛋白。我们还分别得到了两个转录组中高表达值unigene的cDNA序列,即Dc-ADAMTS和Cv-Vn4.6,分析了其序列特征并进行了原核重组表达。颈双缘姬蜂毒液的蛋白组分析使用Shotgun"鸟枪法”蛋白组测序技术对颈双缘姬蜂的毒液蛋白组进行了测序,搜索颈双缘姬蜂转录组数据后共鉴定到319种蛋白,其中包括了“含凝血酶致敏蛋白基序的解聚素与金属蛋白酶(A disintegrin and metalloproteinase with thrombospondin motifs)"、海藻糖酶、丝氨酸蛋白酶、酸性磷酸酶、王浆蛋白4(major royal jelly protein-like4)和气味结合蛋白1(odorant-binding protein1)等的功能酶和蛋白。使用GO分类系统对这些蛋白的功能在二级和三级水平上进行了注释,描述和统计。二级水平上,“催化活性(catalytic activity)"和“结合(binding)"在“分子功能(molecular function)"中包含unigenes的数量最多,这与整个毒腺转录组的GO注释情况类似。菜蛾盘绒茧蜂毒腺与畸形细胞转录组的比较分析通过将菜蛾盘绒茧蜂毒腺与畸形细胞转录组的原始数据一起进行拼接,然后根据unigene在两个器官间的表达水平差异,对unigene的器官分布特征进行了分析。根据我们设定的器官特异表达unigene的标准,有17088个unigene在两个器官中都有表达。3926个unigene在毒腺中特异表达的,包括膜翅目毒液中广泛分布的毒液抗原5和透明质酸酶。而2700个unigene在畸形细胞中特异表达的,其中包括了畸形细胞的标志性蛋白--畸形细胞分泌蛋白(teratocyte secreted protein).这反映了我们预测方法和标准的合理性。本部分研究大大降低了两个转录组数据的复杂度和冗余度,为接下来的研究带来了便利。