【摘 要】
:
最近五到十年间,随着高通量测序技术的发展,生物研究领域产生了大量的基因组测序数据。其中很大一部分是对生物体内和自然环境中的微生物群落取样并测序而产生的元基因组数据
论文部分内容阅读
最近五到十年间,随着高通量测序技术的发展,生物研究领域产生了大量的基因组测序数据。其中很大一部分是对生物体内和自然环境中的微生物群落取样并测序而产生的元基因组数据。元基因组数据包含了整个微生物群落的基因组信息,可以用来阐释人类健康,自然进化和生态构成等方面的诸多问题。对元基因组数据的处理与分析正在成为一个全新的生物信息学研究领域。由于元基因组数据混杂了来自多个物种的DNA片段数据,因此对这些片段的归类成为元基因组数据分析中最重要的问题之一。传统的元基因组序列归类方法大多只能处理已知微生物基因组序列片段的归类问题,但是绝大多数的元基因组数据包含来自未知微生物的基因组序列片段,因此需要一种有效的无监督方法来对这些数据进行归类。本文提出了一种基于无监督聚类的元基因组序列归类方法,命名为MCluster。该方法使用k-mer特征提取方法和一种特征权重可变的的无监督聚类方法,可以有效地将来自不同微生物的DNA序列数据区分开来。与以往的有监督方法相比,该方法并不依赖于已知的基因组序列数据。实验结果表明,MCluster在模拟数据集和真实数据集上的表现都超过了已有的无监督聚类方法,可以作为元基因组研究的有利工具对元基因组测序数据进行聚类,以研究其物种组成和分布。
其他文献
《十八届三中全会关于全面深化改革若干重大问题的决定》中提出建立和完善严格监管所有污染物排放的环境保护管理制度,实行企事业单位污染物排放总量控制制度,对当前企业业绩
<正>在11月初,拉夏贝尔又一次"大热",先是央视财经给予"专门关注",然后上了微博热搜,拉夏贝尔究竟怎么啦?半年亏损超5亿元央视总是能引发潮流,包括在财经新闻上。央视财经在1
<正>满洲八旗兴起辽东,红衣大炮传入中国,由此红衣大炮与满洲八旗便结下不解之缘——同兴、同盛、同衰、同亡。满洲兴衰,原因固多,有如政治、经济、军事;在军事因素中,有如兵
<正>蜀都风韵,锦山秀水。当得知《教师博览》杂志将召集教育界精英代表大咖级人物共赴成都之时,我已然怀着一颗朝圣的心置身其中。认识李镇西先生是在二十余年前的报刊上,他
自2001年中国加入世贸组织后,中国与西方国家在政治、经济、贸易、文化等方面的交流日益密切,社会及用人单位对既精通英语又熟悉商务知识的复合型、应用型人才需求不断增加。
该研究制备了粉煤灰基Mn-Ce@FA催化剂,利用现代分析手段对材料的矿物相、微观形貌与成分、官能团组成等进行分析,将其应用到催化湿式氧化处理医药废水,研究催化剂量、反应温
本文分析了低价基本药物市场的基本情况,从供给侧改革视角探析了低价基本药物出现短缺的原因,并为制定低价基本药物供应保障机制提供依据。
随着我国经济的发展,中小企业对财务管理人才产生大量需求,所以对高校财务管理人才培养提出了新的要求。本文以长春财经学院财务管理专业为例,构建服务于中小企业的“三真”、“
近年来,我国经济不断发展,尤其在工业方面缺取得了较大成就。但工业固废也随着工业发展大量产生,其中一部分尚有利用价值的固废没有被回收,造成了资源浪费。目前,对工业固废
农村中职学校的学生综合素质整体较差,部分学生难教难管是不争的事实。但只要班主任老师充分发挥聪明才智,强化责任意识,在观念、管理上不断创新,提高服务意识,牢固树立质量意识,班