【摘 要】
:
微生物组与其周围的环境形成各种各样的复合生态体系,具有复杂的相互关系。人体微生物组与人类共同进化,被称为人的“第二基因组”。得益于高通量测序技术的快速发展,海量的微生物组数据已经生成。而如何快速、高效地处理这些测序数据,精准地解码微生物组结构和功能与其周围环境的互作关系,从而进一步发掘隐藏在海量数据下的生物学意义变得至关重要。高通量测序序列处理和多样性分析是微生物组研究的基础。然而现在数据预处理和
论文部分内容阅读
微生物组与其周围的环境形成各种各样的复合生态体系,具有复杂的相互关系。人体微生物组与人类共同进化,被称为人的“第二基因组”。得益于高通量测序技术的快速发展,海量的微生物组数据已经生成。而如何快速、高效地处理这些测序数据,精准地解码微生物组结构和功能与其周围环境的互作关系,从而进一步发掘隐藏在海量数据下的生物学意义变得至关重要。高通量测序序列处理和多样性分析是微生物组研究的基础。然而现在数据预处理和分析的方法运行效率低,且大多基于命令行操作不易使用,给多样本、多平台下的应用带来了困难。为解决上述问题,本研究开发了面向微生物组的生物信息工具Parallel-Meta Suite(简称PMS),为处理和分析微生物组序列数据提供可靠的方案。PMS不仅实现了自动、全面的分析流程,还为参数配置以及结果展示提供了简洁易用的图形界面。更重要的是,PMS通过并行计算优化能快速处理上万个样本。因此本文开发的生物信息分析工具给微生物组大规模数据挖掘带来更多机遇。基于PMS所解析出的结构与功能特性,本研究进一步发掘微生物组对人体营养健康的影响。随着生活水平提高,人们愈发重视微量元素的营养价值及其不足引发的问题。硒元素是人体必需的微量元素,然而同样剂量补充,不同人的吸收效率也不尽相同。本文通过对不同吸收效率的人群进行分析、比较,筛选与硒吸收效率相关的生物标记物,利用机器学习的集成方法极端梯度提升决策树,建立肠道菌群与硒元素吸收效率的模型。随后将完整流程封装成易用的工具,快速、精准的评估待测人群队列,判断能否高效吸收硒,为精准营养做好数据化基础。尽管本文初步研究并发现了与营养相关的微生物组,然而仍有许多疾病没有明确的生物标记物,或者基于标记物检测在准确性方面存在缺陷。因此本文提出了基于搜索的健康状态检测策略。该方法将待检样本的物种组成和大规模健康数据进行比较,根据其异常程度识别健康状态;并进一步在疾病数据库中搜索确定详细的疾病类型。在3,000余例的多队列数据集上,该策略获得了较高的总体精度,且在不同疾病上均表现出良好的平衡性,优于随机森林、支持向量机等常规基于生物标记物的模型。本案例进一步探索了微生物组大数据在人类健康领域的潜力和能力。另一方面,在以往人体微生物组研究中,为了调查特定疾病与微生物组的关系,队列中每个样本都用单一的精确标签来记录其健康状态。然而,现实中一个患者可能同时患有多种疾病(即多标签),共同作用于微生物群落结构和功能的变化,从而干扰检测。因此本文回顾了微生物组研究中经典的分类方法,并通过真实的数据集分析了该类方法在多标签疾病检测中的局限性。最后,本研究展望了微生物组在人体健康状态识别方面进一步发展的方向,包括多标签分类的一系列有前景的策略等。
其他文献
电梯作为一种和人们日常生活、工作环境密切相关的特种设备,其安全性时刻被人们所关注。随着我国市场经济的快速发展以及电梯相关技术的进步和成熟,我国电梯保有的数量呈现指数增长的变化趋势。大数据与人工智能的发展为电梯行业特别是电梯故障的研究带来了新的机遇,越来越多的研究者和机构开始从大数据、机器学习的角度去分析研究电梯故障相关的问题。总结已有的参考文献,本文基于不平衡的电梯数据集,创新性地采用机器学习算法
人眼注意机制不仅受视觉刺激的影响也取决于音频信号的刺激,现有视频显著性检测算法仅使用视觉信号作为输入信息,很少考虑音频信号对显著性的作用。然而音频信号中包含语义丰富的听觉信息,此信息对显著性具有重要价值。因此,充分利用音频信号中的语义信息辅助基于视觉信息的显著性检测极有意义。不同的音频分类网络,在不同的数据集下训练,将识别不同的音频语义信息。在处理音频信号时由于网络关注的语义信息不同,将产生不同的
图像分割是计算机视觉、图像处理研究的重要内容之一,在医学影像、遥感影像、智能交通等领域都有着广泛的应用。经典的图像分割方法是依据图像特征将图像划分为不同区域,但却很难处理对象粘连、相互遮挡、及部分特征缺损的细微结构的情形。考虑几何乃至拓扑约束的分割模型是有效的解决方法,但往往带来计算上的困难。基于拓扑约束的自排斥蛇(Self-repelling Snake,SRS)变分模型是实现图像中对象拓扑保持
<正>【热点新闻】近几年,减税降费成为我们一直关注的热点。《人民日报》2023年1月31日报道,2022年全年,我国新增减税降费及退税缓税缓费超过4.2万亿元。2012年1月1日,上海率先推开交通运输业(除铁路运输)及部分现代服务业营改增试点。2016年5月1日,我国在全国范围全面推开营改增试点。2013—2022年,党中央、国务院围绕简并降低增值税税率、深化个人所得税改革、支持科技创新等出台系列
<正>为了满足职工多样化、个性化需求,打造具有特色的工会志愿服务品牌,2020年底,海曙区总工会志愿服务大队成立。志愿服务大队通过志愿服务关爱和帮助身边的困难职工群体,想职工所想,急职工所急,解职工所需,助力工会打通服务职工的"最后一公里"。
深海垃圾是指那些存留在海洋深处或者海底难以降解的废物垃圾。深海垃圾会对海底生物生存造成直接或间接性的威胁。深海垃圾在深海或海底存留时间长,清理难度大,严重污染了海洋环境。目前清理深海垃圾主要方式是通过人工操作水下潜水器机械臂来完成,效率不高。将深海垃圾分类和检测系统装载入自主水下潜水器(Autonomous Underwater Vehicle,AUV)以实现自主清理可以显著提高垃圾清理效率。但关
<正>能源是国家经济发展的重要物质基础,交通是国家经济发展的互融互通命脉,交通发展离不开能源供给。自我国提出“双碳”目标以来,交通行业低碳发展进程迅速、需求旺盛。立足推动能源行业高质量发展,服务国家经济社会发展全局,全面推进交通行业清洁能源的高效利用,
着色旅行商问题是组合优化的一个研究领域。它是多旅行商问题与旅行商问题的一种泛化,可应用在含重复区域的多机器工程系统中的规划问题。CTSP是NP完全问题,目前一些算法已经被用于求解该问题,如遗传算法、蚁群算法等,但一方面传统的智能算法求解该问题时容易陷入局部最优解,在速度和求解质量仍有提升空间;另一方面在智能交通系统和多任务协作等领域,许多问题都可以用CTSP建模,所建模型的规模很容易趋于数百维以上
随着现代教育技术和教育信息化的发展,科普动画片融入基础教育的科学教育越来越引起大家重视。科学教育中的基础概念知识的理解无疑对小学生建构科学知识框架体系具有基础性作用。那么如何利用科普动画片促进小学生基础概念性知识的理解就是一个重要教学研究课题。因此,本研究着眼于探讨科普动画片对小学生概念性知识理解的作用,以及科普动画片教学与传统教学的互补性,试图提出在实际科学教学中融入科普动画片的教学建议。本研究
实际场景中在拍摄图像时,由于物体的运动和相机抖动等原因,所捕获的图像包含不利于获取信息的模糊情况。图像去模糊的目的,即将模糊的图像通过技术手段恢复清晰,这是计算机视觉底层任务中的热点研究方向。现有的图像去模糊技术已经很好地解决图像模糊问题,但在图像的特征信息提取、处理模糊图像的响应速度、图像局部纹理信息的处理、模糊图像数据集的制作等问题上,还存在一定的不足。近年来,深度学习发展迅速,基于卷积神经网