论文部分内容阅读
【背景】肠道菌群与人体健康之间的关系吸引了越来越多的关注,成为目前热门的研究热点。【目的】基于美国肠道微生物组计划公开数据库,对肥胖和健康人群肠道菌群进行比较分析,解析肥胖人群肠道菌群特征,并基于肠道菌群建立机器学习模型预测人群肥胖的状态,为基于肠道菌群干预肥胖提供理论基础。【方法】从公开数据库中获取美国肠道计划中的肠道菌数据,经过筛选得到1655个健康(18.530)成年人的肠道菌群数据。针对α多样性,进行了Wilcox秩和检验分析并通过Logsitic回归判定α多样性与肥胖之间的关系;对Unweighted UniFrac,Weighted UniFrac,Bray-Curtis 3种β多样性距离进行主成分分析(Principal component analysis,PCA)探索肥胖与健康人群在肠道菌群组成上的差异;对于物种差异,进行Wilcox秩和检验探索差异菌属;通过PICRUSt分析预测可能的代谢通路,同时与肠道菌群进行相关性分析。利用Scikit-Learn软件包基于属水平的肠道菌群数据建立肥胖分类机器学习模型,并进行网络搜索确定最佳模型参数。【结果】经过Wilcox秩和检验,发现肥胖人群的α多样性都较健康人群显著下降,Logistics回归表明α多样性与人体肥胖状态有相关性。经过基于Weighted UniFrac,Unweighted UniFrac,Bray-Curtis 3种距离的PCA,肥胖和健康人群的肠道菌群结构上无明显差异;在门水平上,肥胖人群中的Firmicutes和Bacteroidetes比值较低。在属水平上共发现57个在两组之间具有显著性差异的属,其中肥胖人群中的Ruminococcus相对丰度较高,而Prevotella,Akkermansia,Methanobacteriales的相对丰度较低;PICRUSt预测的代谢通路有63个代谢通路在两组之间具有显著差异;梯度提升回归树对于基于肠道菌群预测肥胖人群效果最好,受试曲线下与坐标轴围成的面积(Areaundercurve,AUC)值可以达到0.769,测试集精度可以达到0.725。【结论】基于大规模的肠道菌群数据揭示了肥胖人群肠道菌群的特征,将机器学习运用到肥胖预测上面,为精准膳食、精准医疗提供新的研究思路和理论基础。