论文部分内容阅读
使用通用引物扩增榕小蜂cox1基因,对同一个体的cox1扩增片段同时使用一代测序方式(Sanger测序)与二代测序方式(Illumina Miseq测序)测序,并分析了:(1)基于Sanger测序的DNA条形码分析;(2)基于Illumina Miseq扩增子测序的线粒体异质性分析;(3)结合Sanger测序与Illumina Miseq扩增子测序结果,分析线粒体异质性对DNA条形码的影响;(4)使用高通量测序所得线粒体异质性序列,模拟DNA宏条形码评估多样性分析,以了解线粒体线粒体异质性对DNA条形码评估生物多样性的而影响;(5)基于多种方式验证了线粒体异质性的真实性,而非Numts的干扰。主要结果如下:1.基于Sanger测序的DNA条形码分析。以形态鉴定为基础,通过Sanger测序逐头获取隶属于3科5亚科10属28种,154头榕小蜂的DNA条形码。通过检查序列中是否含有终止密码子,发现其中3头标本所获取的DNA序列为Numts;通过构建NJ进化树,发现其中5头标本所获取的DNA序列可能来自实验过程中的交叉污染。最后有28个物种146头标本的DNA条形码用于后续分析。经计算DNA条形码种内/种间遗传距离,我们发现20个物种的种内DNA条形码遗传差异<2%,但其他8个物种的DNA条形码种内遗传差异≥2%;统计DNA条形码种内/种间遗传差异,发现了明显的overlap:种间最小遗传距离为5.8%(Philotrypesis pilosa(HIS)vs Philotrypesis sp.(HIS)),而有3个物种包括Philotrypesis sp.(HIS),Platyscapa sp.(HIS)以及Eupristina altissima(ALT)的最大种内遗传距离却分别高达7.5%,6.7%,6.7%。通过分析NJ树以及计算遗传距离,我们发现7个物种在NJ树上构成多个分支(分支内平均遗传距离<2%,但分支间平均遗传距离>2%),它们会被认为是由多个隐存种构成的,使得28个物种共形成38个分类单元。2.基于Illumina Miseq扩增子测序的线粒体异质性分析。上述146头榕小蜂共获得4798199条paired-end序列,经质控过滤后,发现两头标本的扩增子序列可能源自交叉污染,将其排除后续分析,最后144头标本共获得1915416条cox1序列,平均测序深度为13300×,单头标本最多获得168086条序列,最少为377条。以100%相似度聚类,逐头分析榕小蜂单体型构成,发现123头标本(85.42%)含有两条以上的单体型,其中17头标本(11.81%)含有高达10条以上的单体型。有54头标本(37.50%)含有MIN^,分布于16个物种中(57.14%)。其中异质性序列之间差异最高可达9.20%(如标本BEN.Sycobia.sp.M12.2,BEN.Walkerella.benjamini.Female.1,CUR.Platyscapa.sp.Male.6,&HIS.Philotrypesis.sp.Male.1);MIN^占比最高的标本为BEN.Walkerella.benjamini.Female.1,14条MIN^占该标本总序列数的78.44%。3.针对由DNA条形码鉴定出可能含有隐存种的7个物种,分别整合7个物种的Sanger测序结果以及高通量测序所得单体型序列并构建NJ树,我们发现虽然Sanger测序所得DNA条形码在NJ树上形成明显分化支,但来自单头标本的高通量测序单体型不仅分布于“姐妹种”上,甚至还会形成新的“隐存种”分支,这表明由DNA条形码鉴定出隐存种的结论,是由于线粒体异质性引起的。4.使用高通量测序所得的线粒体异质性序列模拟DNA宏条形码分析,90头标本的单体型可以聚为单一m OTU,其余54头标本的单体型分别可以聚类为多个m OTUs,甚至Walkerella benjamini(BEN)的两头标本分别可以聚类为14个m OTUs;28个物种的单体型共可以聚类为93个m OTUs,远远大于实际物种数。5.多重方式验证线粒体异质性真实性。通过分析同义突变/非同义突变,应用单体型特异性长片段扩增,以及基于全基因组的BLAST搜索cox1同源片段三种方式,我们确认我们采用的分析手段可以排除绝大部分Numts,最后所得到的单体型可以如实反应标本的线粒体异质性情况。6.线粒体异质性分布没有明显的支系特异性;部分物种中存在较明显的雄性特异性的线粒体异质性。综上所述,本文首次确认线粒体异质性会直接影响DNA条形码;而在应用基于cox1基因的DNA条形码(尤其是DNA metabarcoding)检测生物多样性时,异质性会导致生物多样性被严重高估。