等距特征映射算法的改进及其应用

来源 :常州大学 | 被引量 : 3次 | 上传用户:e5134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代的科学研究中,我们不可避免的会遇到大量的高维数据,这就要求我们对高维数据进行处理。降维算法是处理高维数据的一个重要手段,也是特征提取的重要方式。降维的主要目的是在保持原始高维数据的内在结构的提前下,将在高维空间中的原始数据映射到低维欧氏空间上,以实现维数简约,从而使数据的处理更高效、更便捷。线性降维算法具有较强的数学基础,但是其线性本质并不能揭示复杂的非线性流形,于是又出现了以ISOMAP(等距特征映射)、LLE(局部线性嵌入)、LE(拉普拉斯特征映射)等为代表的非线性流形学习算法。本文主要在分析等距特征映射算法基础上探讨了对其的改进算法,并应用到了工程中。主要做了以下工作:1、分析和研究ISOMAP算法,以及核ISOMAP(K-ISOMAP)算法的原理和步骤。传统的K-ISOMAP算法对于多个分散类簇数据集的低维映射不能较好地表现数据集的内在拓扑结构。因此,将多类多流形算法(MCMM-ISOMAP)中构造邻域图的方法应用到K-ISOMAP算法中,得到一种核化的多类多流形ISOMAP(K-MCMM-ISOMAP)方法。该方法不仅解决了多个分散类簇在低维映射空间中不能较好保持数据集内在拓扑结构特性的问题,而且能够将新的测试数据直接从高维空间映射到低维空间,从而在多类图像数据集中实现图像检索的功能。2、针对化工连续生产过程的时序性及非线性等特征,将一种基于K-ISOMAP、 LDA和KNN集成的非线性故障诊断方法:K-ISOMAP-LDA-KNN方法,应用于化工过程的故障诊断中。首先采用核等距特征映射(K-ISOMAP)算法在保持训练数据内在几何结构前提下进行非线性降维。然后使用线性判别(LDA)算法保持数据的最佳分类效果下进行降维,完成过程的特征提取。最后用K近邻(KNN)算法进行模式分类。将方法应用于仿真化工TE(Tennessee Eastman)过程故障诊断,结果验证了该故障诊断方法有较高的辨识能力。
其他文献
普适计算是一种全新的计算模式,其致力于将由通信和计算构成的信息空间与人们工作生活的物理空间融为一体,支持用户“随时随地”并且“透明”地获取符合其个性化需求的信息服
下一代的互联网数据与服务核心必然是云计算。它被使用在公共服务和按需计算服务领域。云计算不是一个全新的技术,而是在应用和服务创新中派生出来的,多租户就是云计算核心技
如今大数据产业的发展对全球经济发展方式的转变、人类生活水平的提高和国家综合能力的增强起到显著推动作用。为促进该产业又好又快的发展,首要任务就是开放共享数据,但企业
关联规则挖掘是数据挖掘研究中的热点问题之一,其目的是发现数据库中数据项之间存在的潜在联系。关联规则挖掘的重点任务是频繁模式挖掘。然而,由于频繁模式挖掘的复杂性,业
当前实际应用产生的数据维度越来越高,受维度效应的影响,许多在低维数据上表现良好的聚类方法运用在高维数据上时无法获得好的聚类效果。在过去十几年,高维数据的聚类方法是聚类
自主地面机器人技术是智能机器人研究领域的热点。自主地面机器人体系结构把感知、融合、建模、规划、决策、行动等多种模块结合起来,使得机器人系统在复杂环境中完成地面自
机翼是飞机的重要部件之一,是飞机飞行性能的决定因素之一。翼型是机翼性能的决定因素,因而翼型设计是机翼设计的首要环节。现代飞机设计要求翼型的设计周期不断缩短、性能不
随着多媒体技术和网络技术的飞速发展,数字媒体(数字图像、数字视频、数字音频等)已得到了广泛应用,人们在享受快速获取信息的同时,也面临着盗版、信息失控等非常严重的威胁,因
大粒度服务作为服务计算领域一个新兴的研究领域,受到了越来越多的关注。大粒度服务的出现和应用加强了互联网环境中服务共享、重用和集成的能力。为用户快速构建复杂系统提
文本聚类作为一种无监督的机器学习方法,近年来已成为自然语言处理领域中研究的热点,传统的聚类算法只能将一个样本点划分到一个聚类中,但现实生活中,很多事物的归属并没有特