基于K-L散度的核磁共振波谱数据尺度缩放方法

来源 :光谱学与光谱分析 | 被引量 : 0次 | 上传用户:liongliong468
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于核磁共振(NMR)的代谢组学数据分析中,尺度缩放是关键的预处理步骤之一,其主要目的是通过调整数据的方差结构,改善后续的多变量统计分析的结果。从信息熵的角度出发,利用KullbackLeibler(K-L)散度来度量不同实验分组的生物样品的1 H NMR波谱数据的差异程度,并结合单位方差缩放法,提出一种基于K-L散度的尺度缩放方法。该方法先利用单位方差法将数据各变量的标准差调整到同一水平上,再利用K-L散度对各变量进行有监督地加权,增强重要变量、减弱无关变量。由于K-L散度是在概率分布的意义上度量数据间的差异程度,且对于高斯和非高斯分布的数据均适用,因此能更准确地度量不同实验分组样品的1 H NMR波谱数据的差异性,从而更有效地地对谱数据的重要变量进行识别和加权。人群尿液1 H NMR波谱数据的分析结果表明,基于K-L散度的尺度缩放方法能有效抑制噪声变量,同时很好地区分特征变量和非特征变量;提高主成分回归(PCR)模型的判别能力;改善偏最小二乘回归判别分析(PLS-DA)模型的解释能力、预测能力以及对特征代谢物的辨识能力。 Scale-up is one of the key preconditioning steps in nuclear magnetic resonance (NMR) -based metabolomics data analysis. Its main goal is to improve the results of subsequent multivariate statistical analyzes by adjusting the variance structure of the data. From the perspective of information entropy, KullbackLeibler (KL) divergence was used to measure the difference of 1 H NMR spectral data of biological samples from different experimental groups. Based on the unit variance scaling method, a scale scaling method based on KL divergence . The method first uses the unit variance method to adjust the standard deviation of each variable of the data to the same level, and then uses the K-L divergence to supervise the variables supervisibly, enhances the important variables, and weakens the irrelevant variables. Since KL divergence measures the degree of difference between data in the sense of probability distribution and is applicable to both Gaussian and non-Gaussian distribution data, it is possible to more accurately measure the differences in the 1 H NMR spectral data of different experimental grouping samples, Thus identifying and weighting significant variables of the spectral data more effectively. The results of 1 H NMR spectra of urine showed that scales scaling method based on KL divergence could effectively suppress noise variables while distinguishing eigenvariants and non-eigenvariables. It also improved discrimination ability of principal component regression (PCR) models ; Improving the explanatory ability, predictive ability and identification of characteristic metabolites of partial least squares regression discriminant analysis (PLS-DA) model.
其他文献
木脂素是一类广泛的存在于植物的根、茎、叶和果实中的天然代谢产物,具有显著的生物活性。本文研究了从木脂素骨架化合物苯丙素的构建到自身偶联产物的合成。利用不同类型催化剂进行催化反应,得到较高产率的木脂素类化合物,通过生物活性检测出这是一类具有生物活性的新型木脂素。主要工作内容如下:1.首先选用廉价易得的2,4,5-三甲氧基苯甲醛为中间体,摸索得到最佳实验条件,合成具有代表性的α-细辛脑。为了得到不同构
呼气末二氧化碳监测是临床上非常重要的一个参数,特别是对于手术病人、危重病人,呼气末二氧化碳的实时监测提供了客观评价当前病人通气状态、呼吸循环状态、治疗处理措施效果等
伸抓功能是人们生活中最常用的功能之一,因此研究大脑对伸抓运动的控制功能一直是神经领域的热点之一。近年来,随着脑机接口技术的发展,可以初步实现直接解析大脑的运动控制信号
为探索凡纳滨对虾选育技术方法,以A、B、C、D四个凡纳滨对虾选育群体的自交和杂交不同交配组合子代的仔虾幼体,进行耐低温能力的比较实验.实验仔虾发育期为P11~P12,体长6.09~
为探讨牡蛎提取物对小鼠化学性肝损伤的保护作用,研究建立酒精导致小鼠急性肝损伤模型,监测各剂量组小鼠体重,测定肝组织丙二醛(Malondialdehyde,MDA) 、还原型谷胱甘肽(Glut
现代医学研究领域的快速发展,促进了各种人体图像信息采集设备不断出现,先后出现的计算机断层扫描(Computed Tomography, CT)、核磁共振成像(Magnetic Resonance Imaging, MR