论文部分内容阅读
背景:劳亚食虫目(Lipotyphla)的现生类群包括沟齿鼩科(Solenodontidae)、鼴科(Talpidae)、鼩鼱科(Soricidae)和猬科(Erinaceidae)等四科以及更新世晚期灭绝的岛鼩科(Nesophontidae)。然而迄今为止还没有任何该目物种转录组分析的报道。目的与意义:对劳亚食虫目动物进行转录组测序和分析,为相关物种的物种进化以及适应性演化的研究提供了基本数据,在生命科学和医学研究中对特定器官功能基因的鉴定及其分子作用机制研究也有重要价值;对人类流行病防控、对生物多样性保护也有参考意义。研究方法:本课题选取鼹科中的长吻鼩鼹(Uropsilus gracilis)和库氏长吻鼹(Euroscaptor kuznetsovi)、鼩鼱科中的小纹背鼩鼱(Sorex bedfordiae)、云南长尾鼩鼱(Episoriculus umbrinus)和蹼足鼩(Nectogale elegans)和猬科中的鼩猬(Neotetracus sinensis)为研究对象,对这六个物种采集活体动物,抽提心、脾和肺的RNA,构建转录组文库,通过Illumina Hiseq X10平台进行PE150测序。对测序数据进行质检、从头组装和去除冗余序列、完整性分析、同源功能注释和识别及富集分析、同源蛋白分析和基因差异表达分析等分析。研究内容和结果:(1)首次获得劳亚食虫目如上3科6物种的各2器官心、肺和脾的转录组数据。(2)我们通过从头拼接,获得上述样品从147,194至223,124个转录本。(3)我们使用BUSCO分析转录组组装的完整度,发现通过优化方案鼹科、鼩鼱科和猬科经Trinity组装获得的完整单拷贝基因分别可以达到 43%-56.6%、66.5%-75.1%和 79.4%。(4)我们将鼩猬与 GenBank 中鼩鼱科的普通鼩鼱(Sorex.araneus)和鼹科的星鼻鼹(Condylura.cristata)两个物种基于基因组预测获得的基因注释文件进行比对,发现星鼻鼹、普通鼩鼱和鼩猬共有11,182个直系同源基因。(5)通过对鼹科、鼩鼱科和猬科三个科六个物种不同组织间的基因表达差异分析,得到了各个组织的标志性基因。其中,鼹科脾脏中高表达LY86和CR2,肺部高表达SFTPB、SFTPA1以及心脏高表达HRC和MB;鼩鼱科心脏高表达MB和MYH6,肺部高表达SFTPB和SFTPC;猬科心脏中高表达MYL2和MYL3,肺部高表达SFTPC和SFTP1。(6)比较鼹科两个物种肺部基因的表达差异发现库氏长吻鼹335个相对高表达的基因,其中包括HMGB1、HSPD1、SF3B1、COL3A1、SUMO1和JUNB等,有报道上述基因可能与低氧或高海拔适应有关。主要结论:(1)首次对鼹科、鼩鼱科以及猬科三个科六个物种的转录组进行测序。(2)通过数据分析,我们比对了上述六个物种的转录本及其特异基因。(3)我们使用BUSCO分析转录组组装的完整度,方案二明显提高了转录本的比对效率和数据质量。(4)通过对六个物种的不同组织进行基因差异表达分析,获得了心、肺和脾组织特异性表达的基因或高表达的基因,这些器官特异性基因对器官的功能有特定意义。(5)我们获得了长吻鼩鼹和库氏长吻鼹相同组织肺差异表达基因。