细菌必需基因团簇模型的研究与特征分析

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:xiaozhi_1100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
必需基因指的是在优化生长的前提下对有机体的生存和生长不能缺失的基因。研究必需基因有如下重要的意义:(1)必需基因可以作为构建最小基因集的基础,通过对必需基因的研究可以帮助我们了解生命的起源和进化,生产工业实用型微生物;(2)必需基因编码的蛋白质通常参与最重要且基础的代谢过程,因此,可以作为抗菌药物的靶标。近年来,必需基因的研究已经成为生物信息学研究的热点之一。本文的研究对象是由湿实验方法确定的细菌必需基因集。其原始的必需基因数据来自于必需基因数据库DEG(http://tubic.tju.edu.cn/deg/)。受COGs(https://www.ncbi.nlm.nih.gov/COG/)中团簇的启发,我们提出了细菌必需基因团簇模型的概念,就是将具有相同或者相近功能的必需基因以团簇的形式进行存储,这也是与当前大多数存储基因的数据库的最大不同,团簇的大小反映了该类基因的保守性强弱。到目前为止,细菌必需基因数据进一步丰富,例如DEG的最新版本(截止到2017年3月)收录了46套细菌必需基因数据集和16套真核生物细菌的必需基因数据集,为相关研究奠定了基础。基于必需基因团簇模型和最新的数据,我们构建更新了细菌必需基因团簇数据库(CEG,Cluster of Essential Genes,http://cefg.cn/ceg/),其版本称之为CEG 2.0。在该数据库中,以团簇的形式存放必需基因,并进一步增加并丰富了和必需基因相关的很多信息,如:增加了基因编码蛋白质结构、基因毒力因子、基因参加的代谢通路以及与基因相关的药物等重要信息。另外,我们将细菌必需基因与人类基因序列作比对,提供用户两者的同源性信息。这些信息在新的药物靶标发掘过程中,具有极大的借鉴意义。团簇的大小也具有重要的生物学意义,团簇越大,其中包含的基因就越保守,用户通过观察团簇的大小,就可以直接看出具有该功能的基因的是在多物种中普遍存在的,还是个别物种所具有的。根据构建的CEG数据库,我们提出了一种新的基于存储的团簇大小来预测细菌基因必需性的算法—K-value。K-value算法的主要原理是依据团簇的大小进行必需基因的预测,在预测的时候,只需要用户提供基因的基因名即可对基因完成预测。最后,我们编程实现了此算法,称之为CEG_Match。在CEG 2.0中的CEG_Match,我们增加了新的功能,用户不仅可以根据基因功能进行预测,还可以根据基因序列信息进行预测。该预测工具与传统的必需基因识别方式比较,在保证不低的准确率的基础上,对非必需基因的识别率更高,而且执行效率更快。这解决了CEG 1.0中的预测算法只能根据基因名进行预测的缺陷。最后,对本文构建的数据库信息进行统计,包括物种、团簇以及基因功能等,并对以后可开展的工作进行了展望。
其他文献
积累材料、选择材料是写好文章的关键性环节,在这一问题上宋代诗人陆游曾说:“汝果欲学诗,功夫在诗外”所谓的“诗外”就是多积累材料,多读诗歌。只有“读书破万卷”才能做到“下笔如有神”。当然,积累材料除了书本外,还要加强对生活素材的积累,清代文学家曹雪芹说:“世事洞明皆学问,人情练达即文章。”明白洞察世间事务就是有学问的人,纯熟通达人的感情的人就能写出好文章,可见生活是写作的源泉。这段话概括了创作中积累
为了实现道路与沿线用地发展的良性互动,促进交通效率与城市活力的并重发展和提高交通出行的安全性、舒适性和趣味性,提出道路空间设计方法.该方法将道路两侧建筑或植物围合
<正>我国是一个养猪大国,养猪业在畜牧业中占有重要的地位,我国人民非常喜欢吃猪肉,猪肉人均消费有很大的潜力。河南省地处中原,是我国的养殖大省,2018年河南省的生猪年出栏
本文研究了菌丝生长所需要的碳源、氮源、无机盐、pH值以及离褶伞子实体浸出液对荷叶离褶伞菌丝生长的影响。结果表明,荷叶离褶伞菌丝生长最适碳源是葡萄糖,最适氮源是蛋白胨
数字集群通信系统在移动通信系统中极具优势,可以扩展数字集群移动通信系统的容量,提供更高频谱利用率和更好的通信质量。数字集群系统有图像、数据和话音等各种通信业务。本文