论文部分内容阅读
基因组岛是由水平转移基因与移动元件等构成的基因簇,可以通过转导、结合、转化等方式进入细菌中。基因组岛具有独特的组分和功能特点,常常携带一些与微生物进化和环境适应性相关的功能基因,如致病性和抗生素耐药性基因。因此,基因组岛的识别分析已经成为微生物功能基因组研究中的一项重要研究课题之一。本文重点围绕基因组岛的识别与分析,构建了基因组岛的数据库,搭建了基因组岛的在线识别与分析平台。其主要内容安排如下: 1.整理了基因组岛的相关数据。重点介绍了现有的基因组岛数据库和现有的识别算法;系统地整理了基因组数据,利用基因组岛识别方法,获得了现有基因组的预测结果,按照从UniProt数据库中获取基因注释的流程,整理了预测基因组岛中的基因注释数据。 2.构建了基因组岛的数据库。根据基因组岛的数据类型,分析了内容之间的关联,利用关系型数据库设计了基因组岛数据的存储模型;由于基因组岛数据的特殊性,利用冗余备份和水平分解的方法,优化了数据库的访问效率;针对数据库的扩展性问题,本文提出了相应的解决方案。 3.搭建了基因组岛的识别与分析平台。根据基因组岛的展示内容,采用了分层展示策略,设计了基因组岛数据的展示方案;比较了几种常用的基因组岛可视化的图形格式,选取了SVG作为展示图形的格式生成图形,实现了基因组岛数据的可视化,从而克服了由位图难于实现而引起的交互问题;根据现有的基因组岛识别方法的特点,系统整合了识别算法,搭建了基因组岛的识别平台;针对科研人员的需求,本文对基因组岛数据库以及识别分析平台进行了Web发布,实现了基因组岛数据的在线浏览、在线识别和在线分析。