论文部分内容阅读
摘要:代谢组学作为一种新发展起来的系统生物学分支学科,研究的是生物机体内或是细胞组织系统内的动态代谢变化。糖尿病动物模型的代谢组学研究,对探究糖尿病及其并发症等的发病机制、降糖药的药理疗效以及及早发现并预防糖尿病,均具有十分重要的现实意义。本文重点研究随机森林算法在代谢指纹图谱中的应用,主要内容如下:一、基于C57BL/6J小鼠和经诺和龙/罗格列酮治疗的不同周期的糖尿病KK-av小鼠的尿液样本中小分子内源性代谢产物的定性定量信息,采用随机森林算法(RF)构建了糖尿病小鼠经其治疗后的代谢轨迹模型图,并经过树数目的选择、相似度矩阵、多维尺度变换等处理,获得不同组类小鼠的聚类信息,以及糖尿病小鼠经降糖药治疗后的不同周期的代谢变化轨迹。继而通过分析随机森林中变量重要度筛选出的代谢物,探究诺和龙/罗格列酮治疗糖尿病的机理及疗效。结果表明随机森林较之主成分分析(PCA)能得到更好的聚类信息,并能使其治疗的代谢轨迹清晰可视化。且模型中糖尿病小鼠逐渐向健康小鼠靠拢,也即经诺和龙/罗格列酮治疗后,其能很好调节血糖、多元醇以及有机酸,糖尿病小鼠的代谢模式逐渐转向健康小鼠。二、基于C57BL/6J(雄性和雌性)小鼠和AMPKa2-KO(雄性和雌性)小鼠的尿液样本中小分子代谢物的定性定量信息,采用随机森林得到四类小鼠间明显的聚类信息。同样运用其重要变量度筛选出不同组类小鼠中的重要内源代谢物。以此分析AMPK基因对生物机体内物质代谢的影响,并探讨了其对不同性别小鼠的代谢模式的不同影响。为进一步研究糖尿病的影响因素及致病机理提供了一定的依据。以上研究可以表明,采用随机森林算法分析代谢指纹图谱可以得到很好的聚类信息以及发掘其中潜在的重要生物标记物,其为进一步综合分析研究药物疗效、基因对疾病的影响提供了有理有力的依据。