论文部分内容阅读
山羊作为最早被人类驯化的家畜之一,在长期的演化过程中,其行为、生理和形态等方面与野生祖先相比发生了很大的变化。跨物种的基因交流在动物驯化过程中扮演着重要进化作用。结合考古学研究和古代与现代样本基因组分析,有关山羊起源驯化的问题已取得一定进展。然而,关于欧亚广泛分布的野生近缘种对山羊驯化的遗传贡献仍不清楚。本研究对88只家山羊(Capra hircus)、1只伊朗野羊(C.aegagrus)、1只西高加索羊(C.caucasica)、1只欧洲北山羊(C.ibex)、3只捻角山羊(C.falconeri)、3只西伯利亚北山羊(C.sibirica)和4只努比亚北山羊与家羊的杂交后代(C.nubiana×C.hircus)进行了全基因组重测序,并结合已发表的古山羊、现代山羊和伊朗野羊基因组数据,共计收集到近东地区51个古代样本、全球范围内164只家羊、4只努比亚北山羊与家羊的杂交后代和33只野羊的全基因组重测序数据。通过对上述样本的全基因组遗传变异分析取得如下结果:1.通过比较分析不同地区山羊全基因组遗传变异,我们发现世界家山羊按地理分布分为四大主要类群,即东亚、西南亚-南亚、非洲和欧洲。同时,家山羊的直接祖先伊朗野羊可分为3个亚群:分别位于伊朗西南部的Zagros、伊朗北部的Alborz和伊朗西北部的Azerbaijan。2.我们发现亚洲、非洲和欧洲家羊群体两两之间的分化时间早于驯化时间,并检测到不同伊朗野羊亚群和家羊群体存在差异的遗传组分共享。以上结果支持山羊驯化多起源的假说或者驯化后不同遗传背景伊朗野羊的渗入。已有研究发现新石器时代(~7,500-11,000年前)山羊群体中存在六种主要的线粒体单倍型(A、B、C、D、G和F),新石器之后变为以A单倍型为主(频率大于90%),联合古代样本我们发现Y染色体的单倍型的谱系地理结构相对稳定,表明驯化后山羊种群扩散主要以携带线粒体单倍型A的雌性个体为主。3.通过对跨物种的基因交流分析发现山羊在驯化与迁徙扩散过程中与西高加索羊、欧洲北山羊、捻角山羊和西伯利亚北山羊存在不同程度的基因交流,其中地理区域离山羊驯化中心最近的西高加索羊对世界家山羊群体的遗传贡献最大。在家山羊中共找到了112个包含81个蛋白编码基因的外源渗入片段,基因富集分析发现多个与免疫相关的基因。4.对渗入单倍型的频率分析发现在家羊群体中频率最高(0.96)的渗入片段包含MUC6基因。将该渗入单倍型和山羊野生近缘物种基因组进行同源比较,发现该渗入单倍型来自于西高加索羊或其近缘种。通过转录组测序、实时荧光定量PCR和免疫组化研究发现MUC6主要在山羊皱胃幽门和小肠球部高表达,结合MUC6在牛与绵羊上的功能研究,我们推测受到选择的MUC6单倍型对山羊驯化早期适应人工圈养环境具有重要作用。此外,本研究基于动植物大规模基因组重测序数据开发了拷贝数变异检测软件CNVcaller。与人的参考基因组相比,大部分动植物参考基因组组装质量较差。现有的拷贝数变异检测软件主要基于人的基因组设计和优化,用于大规模动植物基因组重测序数据时速度较慢、错误率较高。因此,我们针对动植物基因组的特点以及大群体重测序数据开发了CNVcaller。该软件主要通过滑动窗口统计比对上的测序读段数来进行拷贝数变异检测。模拟数据和实际数据结果表明:相比常用的CNVnator和Genome STRiP拷贝数变异检测软件,CNVcaller具有更高的运行效率和较高的准确性与灵敏度。