论文部分内容阅读
细菌,作为微生物的主要类群之一,与人类社会存在着十分密切的关系。其中比较受大家关注的是致病菌对人类健康和生命安全的威胁:随着人类生活范围的拓展,许多以前未知的细菌被发现,成为致病菌的一员;同时,随着环境的变化,已知的致病菌为适应环境而发生变化,产生新的表型。因此,面对致病菌日益严重的威胁,我们有必要开展细菌进化研究,去探究新致病菌或致病菌新表型的产生机制,从而为病原菌的防控以及治疗提供理论基础。另外,细菌在自然环境中几乎无处不在,目前科学家发现并命名的细菌种类(9000多种)只占整体的一小部分,据估计地球上分布的细菌种类在100万到10亿之间。对于细菌多样性问题,我们有必要研究它的遗传基础和进化机制,进而为深入探究生命起源以及进化规律打下基础。由于基因组携带着物种所有的遗传信息,基于基因组数据开展进化研究将更能真实的还原物种的进化过程,而目前测序技术的发展和普及为我们提供了丰富的细菌基因组数据,因此我们可以基于基因组数据开展细菌基因组进化研究,这对深入了解细菌的遗传和功能特性,以及进化机制有着重要的促进作用。细菌基因组进化研究主要分为两方面的内容:系统发育学分析,即通过系统发育学方法阐述细菌间的亲缘关系,这在细菌分类、鉴定以及其它多样性分析领域都发挥着关键性的作用;细菌基因组动力学研究,主要是探究细菌基因组进化过程中的各种进化事件,比如基因获得、基因丢失、重组、位点突变、基因水平转移、转座等,通过明确这些进化事件来还原细菌基因组的动态进化过程。因此,我将基于这两方面内容开展我的博士研究工作。首先,我们开展系统发育分析方法的研究。目前系统发育分析方法可以简单概括为3类:基于直系同源序列分歧度的系统发育分析方法,基于基因组特定序列特征分布模式的系统发育分析方法,基于信息论方法的系统发育分析方法。这些方法都有着一定的适用范围,而且本身也存在着一些缺陷,如此引发了一系列问题。比如,不同系统发育学方法在针对同一研究对象时可能得出不同的结论,这种不一致性阻碍了我们对其进化关系的认识。这些问题的一个重要原因是:虽然这些方法的目标都是为了获得一个最能反映物种真实进化历史的系统发育关系,但由于使用不同层次的基因组信息来阐述进化事件,因而反映的进化信息也是片面的,进而导致上述方法的各种局限性。在本研究中,我们在已有的认识上提出一种新的序列特征——同源子序列,并定义一种新的亚基因水平的进化单位——同源子序列家族,通过比较不同菌株间同源子序列家族的分布差异来计算菌株间的进化距离,进而推断菌株间的系统发育关系。这种新的系统发育分析方法被用于重新阐述大肠杆菌和志贺杆菌的进化关系,发现志贺杆菌具有独立起源,且早于大肠杆菌,之后通过趋同进化的方式,使得这两种细菌在基因组水平和表型水平存在着多种共性,该结果表明这种系统发育分析方法具有较高的可靠性和准确性。另外,该方法可以用于开展微生物分类学研究,研究结果表明在所构建的生命之树上,分支的拓扑结构与分类单元存在着明确的一致性。因此,该方法将为微生物分类研究提供了新的策略和手段。其次,我选取了三种重要致病菌作为研究对象,并通过基因组测序以及已有的公共数据开展基因组动力学研究,通过重构细菌基因组的动态进化过程,并将这些遗传变化与表型差异进行关联(如毒力增强),来加深对细菌特性以及进化机制的理解,具体的内容如下。布鲁氏菌104M疫苗株的比较基因组学分析:布鲁氏菌是一种胞内寄生菌,可以引起牛、羊、猪等家畜以及人的布鲁氏菌病,对经济和公共安全是一个重大威胁。目前布鲁氏菌病的防控主要是通过接种疫苗,而事实证明活体疫苗对控制动物感染有着明显的效果。但目前有关活体疫苗的减毒机制不是很清楚。牛种布鲁氏菌104M是一个疫苗株,主要用于国内牛种布鲁氏菌病的防控。我们通过对牛种布鲁氏菌疫苗株104M进行基因组测序,获得该疫苗株的全基因组序列;然后开展104M基因组的比较基因组学分析,发现了一组可能与104M毒力衰减相关的基因,这些基因发生丢失或者突变可能导致104M的毒力减弱;这些基因也为进一步的布鲁氏菌疫苗株减毒机制研究提供了潜在的靶标。奈瑟氏菌的适应性进化分析:奈瑟氏菌是一种定植于动物黏膜表面的革兰氏阴性菌。在已知的14个奈瑟氏种中,仅有两个种,即脑膜炎奈瑟氏菌和淋病奈瑟氏菌,是致病菌,其它均为非致病菌。到目前为止,有许多关于这两种致病菌的比较基因组学研究,并发现重组在奈瑟氏菌的适应性进化过程中发挥着关键性的作用。但是,很少有研究关注过正选择对奈瑟氏菌进化的影响。我们通过探究携带有重组信号和正选择信号的基因来阐述这两种进化机制在奈瑟氏菌适应性进化过程中的作用。结果发现奈瑟氏菌经历过高频率的重组事件,而且涉及重组的基因没有功能偏性;而携带有正选择信号的基因,其功能与重组以及离子代谢相关,是奈瑟氏菌为适应变化而做出的改变。嗜麦芽菌全基因组动力学分析:嗜麦芽菌是一种重要的临床病原体,在全世界范围内流行;另外,嗜麦芽菌也广泛存在于自然环境中。一系列分子分型结果表明嗜麦芽菌具有非常高的遗传多样性,但导致其遗传多样性的遗传机制目前不是很清楚。我们使用目前所有的公共的嗜麦芽菌基因组数据,在基因组水平重新阐述嗜麦芽菌的遗传多样性以及探究导致这种多样性的遗传机制,结果发现重组对嗜麦芽菌遗传多样性的贡献最多,基因获得和基因丢失次之,正选择贡献最少。基于这个角度,我们可以得到嗜麦芽菌种进化过程的一个全视角,对深入理解嗜麦芽菌的基因组动力学有着很好的促进作用。