整合进化树信息的微生物组数据分析方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:banlangen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微生物群落对人类的健康和疾病有重要的作用,而微生物的分布通常以物种的相对丰度(成分数据)来衡量,一般的统计学方法不适用于此类成分数据。针对于相对丰度的成份性问题,科学家们提出了三种经典转换方法:加性对数比转换,中心对数比转换和等距对数比转换,通过转换使得一般统计学方法得以使用。系统进化等距转换在等距对数比转换的基础上引入系统进化树的信息,提供了一个系统进化树和微生物丰度相结合进行分析的框架,可提高微生物组数据分析的效率。系统进化树记录了物种的进化关系,系统进化等距转换通过引入进化树的信息使其能够从遗传进化的角度来对微生物组学进行分析和解释。本文主要建立在系统进化等距转换的框架之上,做了以下两点工作:第一,在系统进化等距转换加权时整合系统进化树的拓扑结构信息。系统进化等距转换对转换后的“平衡结点”加权时只考虑了进化树分支长度,没有利用其他进化树拓扑结构的信息,本文对系统进化等距转换后的“平衡结点”加权时进一步地利用进化树的高度和进化树的子节点数来衡量权重,对于进化树高度更高以及子节点更多的结点赋予更大的权值。利用这一点对系统进化等距转换方法进行了改进,并在三个微生物数据集上,通过对比四种常用机器学习分类的准确率,证明了本文的加权策略是有效的。第二,基于进化树的信息构建微生物网络。系统进化等距转换方法已经对进化树的信息和物种的丰度数据进行了结合,但系统进化等距转换后新的变量不再是微生物,而是许多微生物的杂合,直接使用系统进化等距转换来构建微生物网络存在难以解释的问题。本文基于等距对数比转换和中心对数比之间的变换关系,将系统进化等距转换变换到中心对数比的形式,并利用中心对数比的形式计算相关性,基于此来构建微生物网络。通过这种方式,将进化树信息与物种丰度数据结合来构建微生物网络,能够从遗传进化的角度分析微生物之间的交互关系。微生物成份数据与系统进化树信息的整合一直是一个难点。本文基于系统进化等距转换框架将微生物的成份数据与系统进化树的信息进行了整合,并利用进化树的高度及子节点数对系统进化等距转换做出了改进,进一步提出了一种构建微生物网络的方法,实验结果表明本文提出的两种方法是有效可行的。
其他文献
选址决策在企业运营管理中具有十分重要的地位。一个产品从原材料制成零件、组装成部件到产品总装,再经过分销、零售到达消费者手中,要经过不同企业的劳动,克服地域和时间的
“人文奥运”是北京奥运会提出的三大理念之一,也是现代奥林匹克运动的思想精髓。其所具有的教育本质同我国所提倡的社会主义思想道德建设有许多相同之处,应当用马克思主义的哲