细菌基因组岛相关模块的挖掘与分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:bear139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究通过文献挖掘和生物信息学分析,对细菌基因组岛和其相关遗传元件进行了识别和比较分析。并以碳青霉烯酶KPC产生菌肺炎克雷伯菌临床菌株HS11286为例进行了具体分析。  细菌基因组差减杂交模拟工具mGenomeSubtractor可以对细菌基因组岛进行快速预测和分析。为进一步完善该工具和提高人机交互性,我们对程序代码进行了升级,增强了运行稳定性和结果的可靠性。数据管理方面通过改善数据存储结构和处理方案,大幅减少了数据冗余,节省了存储资源,并方便后续的数据更新。任务管理引入了作业调度系统运行mGenomeSubtractor2的核心计算任务,避免了多个用户同时提交任务时造成的系统崩溃问题;通过修改大量bug和对程序处理进行优化,增强了程序的稳定性。而且为了适应软件和硬件环境的变化,提高运行效率,我们采用并比较了三种方案从而对限速步骤mpiBLAST的核心参数进行优化,选取最优的方程作为参数选择方案,明显提高了运行效率。同时,我们更新了本地基因组数据库,增加了2078个可供用户选择进行比较分析的细菌复制子。而对不完全测序的细菌基因组,也开发了contig/scaffold分析模块,能够一步实现基因组草图的ORF预测和差减杂交分析。  部分细菌基因组岛中存在IV型分泌系统(T4SS),并且依赖 IV型分泌系统实现接合转移。我们通过文献挖掘以及比较基因组学的方法,共收集了10752个组分蛋白,构成811个T4SSs;包括95个已经被实验验证的T4SSs,在这其中有95%的T4SSs有相应文献描述。同时收集了1884个T4SS效应物,其中1638个有文献支持。对T4SSs数据信息进行分析挖掘,匹配了组分蛋白、T4SSs、效应物以及相关文献等的对应关系,为开发IV型分泌系统数据库提供数据支持。在T4SSs分类方案中,我们定义了两类新的T4SS家族。我们在肺炎克雷伯菌HS11286染色体上预测出两个T4SSs,在其中一个质粒上预测得到一个T4SS。它们的功能有待进一步研究,目前没有发现已知效应物的存在。  tRNA和tmRNA基因的3’-端是细菌基因组岛在染色体上的常见插入位点,但对ncRNA基因与基因组岛的关系还没有系统的研究报道。为识别完全测序细菌基因组中的ncRNA基因,我们对常用ncRNA预测工具sRNAPredict和PORTRAIT进行评估。结果发现两种工具预测效果各有优缺,且均随基因组G+C含量不同而产生明显变化。提取并依据不同G+C含量细菌基因组中ncRNA基因启动子和终止子区域的序列特征,能提高sRNAscanner预测ncRNA基因的准确性。因此我们认为不同G+C含量基因组中ncRNA基因转录单元特征是ncRNA基因预测的重要参数之一,这为提高ncRNA基因的准确预测提供新的思路。同时我们对肺炎克雷伯菌HS11286中ncRNA基因进行识别,探究了其与基因组岛的位置关系,发现基因组岛周围或者内部有可能存在ncRNA基因。  重复基因之间存在的剂量补偿和功能补偿作用,可能对细菌耐药性的产生有一定贡献作用。而目前并没有针对原核基因组的重复基因识别工具,因此我们开发了细菌基因组中重复基因的网上快速识别工具triP。为探讨triP预测重复基因的准确性,以肺炎克雷伯菌HS11286为测试对象,预测出了46个可能的重复基因。5个groups中的11个重复基因与DEG数据库中细菌持家基因同源,其中两个groups中的重复基因有文献支持。这表明triP对细菌重复基因的预测有一定的准确性。
其他文献
目的:分析经皮胃造瘘术(percutaneous gastrostomy,PG)在食管梗阻病人中的应用.方法:收集2016年9月至2019年9月,在我院因食管梗阻行胃造瘘术病人的临床资料.比较PG与开腹胃造
随着对小型、轻量、多功能化、高集成度电子产品需求的日益增多,利用低温共烧陶瓷(Low Temperature Co-fired ceramic,LTCC)技术设计和制造微波介质元器件已成为当今的研究热点。此外,选用具有较高介电常数的微波介质陶瓷作为关键材料,可以有效的减小现代通信广泛使用的微波元器件(谐振器、滤波器、介质导波回路等)的尺寸。因此,对高介电微波陶瓷的掺杂改性和低温烧结的研究,对微波元
作为新一代的视频编码国际标准,H.264/AVC相比以往的标准,压缩性能有很大的提升,但编码器的复杂度也大为增加。在H.264/AVC编码器中,模式选择过程具有很高的计算复杂度,因此如果对
目的:神经元蜡样脂褐质沉积症(neuronal ceroid lipofuscinoses,NCLs)是一组人类进行性神经元变性疾病,多为常染色体隐性遗传。基本特征为溶酶体内蜡样脂褐质沉积。主要分为N
由上海交通大学医学院附属瑞金医院外科﹑ 上海消化外科研究所﹑上海市胃肿瘤重点实验室主办的“2019中国胃肠肿瘤圆桌会议”于2019年12月28日至29日在上海召开.本届会议主题是“
随着数字化传感器的发展,对高精度的ADC的需求日益强烈,Sigma-deltaADC正是在这种环境下应运而生。由于其较高的精度和相对较低的工艺要求,使得它在信号处理领域备受关注。而
[目的]核算湖南省2017年预防费用,追踪不同来源资金的实际分配和使用情况.[方法]基于SHA2011框架核算湖南省预防费用总量、筹资方案、机构流向、服务功能等.[结果]2017年湖南
摘要:在新一轮的高考改革中不仅对学生的逻辑思维能力和应用能力要求较高,也重点考查学生的计算能力,虽然近几年高考试题的计算量略有降低,但并未削弱对计算能力的要求。即要求运算要熟练、准确(基本功),而且运算要简捷(基本方法与技巧)。而近几年对于刚刚步入高中的初中生,我们却遗憾地看到他们的计算能力非常薄弱。究其原因,主要是初高中教学大纲对计算能力要求的不同,所以给高中数学教学工作带来了新的压力,也间接影