非线性稀疏切子空间聚类方法研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:myazx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代大数据的爆发,当今各行各业产生大量的数据迫切需要被处理,它们不仅规模庞大、维度高并且数据内在结构复杂。高维数据一般具有更复杂的非线性结构,分析和处理难度大。然而具有多个流形结构的高维数据可以映射到各个低维的子空间中,即对数据同时进行降维和聚类,降维和聚类之后的数据以便于之后分析和处理。流形学习是数据降维的常用手段之一,它假设高维数据中嵌入了一个低维的数据流形,即数据本质是低维的,然后通过数据之间的距离关系找出这个低维数据流形,从而达到降维的目的。虽然流形学习能够找出数据本质的几何结构,但是只适用于单个数据流形情况。更普遍的情况下,高维数据的结构为多个不同维度的数据子流形交错在一起的情况,不同的流形来自于不同的低维子空间。子空间聚类旨在找出来自不同子空间中的数据流形从而达到对多个数据流形聚类的目的,该方法广泛应用于图像处理(图像压缩、图像表示),计算机视觉问题(图像分割、运动分割等)、系统识别、机器学习等领域。谱聚类是子空间聚类的基本方法之一,稀疏子空间和低秩子空间聚类都是基于谱聚类的方法。稀疏子空间聚类是在数据空间找出一个数据的稀疏表达,稀疏意味着由该数据同一个子空间参与表出的数据的系数尽可能非零,而由其他子空间参与表出数据的系数尽可能为零。低秩子空间聚类思想和前者相似,区别是对参与线性表出数据的系数矩阵加入低秩约束,因为矩阵中每个向量稀疏不能推导出该矩阵低秩。稀疏子空间和低秩子空间聚类都只适用于线性子空间中的数据流形,为了将线性子空间推广到非线性子空间本文提出一种聚类方法称作稀疏切子空间聚类(STSC)。该方法构造一个加权?1范数的凸优化问题,加权系数包含了非线性数据流形上局部和全局的几何结构信息,它的优点在于巧妙地利用线性表达求出非线性数据所在的各个子空间。针对所提出的凸优化问题中的加权?1范数,本文提出一种加权梯度算子,用于求得在约束条件下该范数近似的闭式解并采用增广拉格朗日乘子(ALM)求得整个凸优化问题的稀疏表达。最后本文将STSC算法应用于简单数据集、运动分割和人脸聚类三种具有代表性的聚类问题,同时对几种常见的子空间聚类方法在同样的数据集中做了仿真实验,并分析和对比它们的优劣之处。
其他文献
随着网络带宽的飞速提升、实时业务和多媒体应用的普及,网络规模以指数规律增长,IP网络的控制机制和行为特征也日趋复杂和难以理解.为了认识和掌握现代网络的行为特征和性能
多处理机调度问题是并行处理中的一个著名问题.调度的主要目的是优化并行程序在系统中运行的一些指标,本文中调度的主要目标是缩短调度后并行程序的执行时间和提高多处理机系
该文结合某省科技厅科技评估工作而开发的基于专家信息的甄选专家系统被称为ESDM(Experts-Selecting Decision-Making).近几年来,随着计算机网络、通信等技术的发展,特别是In
电子政务是利用信息技术和网络技术实现政府的电子化公共管理与社会服务职能的新型计算机应用技术,其是政府行政体制改革和实施政府职能转变的重要技术基础。本文以如何将传统
基于DSP的快速发展,上海大学微电子中心和北京东世半导体科技有限公司联合开展项目"16位定点数字信号处理器DSPD16的设计".本论文来自于此项目的内核设计.本文首先介绍了数字
众所周知,信念变化是人工智能的重要研究内容之一。最近,以色列著名人工智能学者Bochman建立了一种一般的信念变化理论框架,这种框架试图将表示信念变化的两种最主要的方法,即,信
网格是一种包含大规模分布异构资源的复杂系统,资源监控系统对于网格系统资源管理和健壮运行有重要意义。本文从基本理论和设计实现角度分析了网格监控系统的特点和问题,总结
随着分布计算和网络技术的不断发展,传统的数据库技术已越来越不能满足数据共享和互操作的需要。同时,已有的数据库系统又不可能全部丢弃,因而研制能同时访问和处理来自多个数据
本文对非线性信念修正的若干问题进行了讨论,取得的主要结果如下: (1) 建立了基于部分交构造的由非线性序选择机制决定的满足某种完备性条件的一类收缩算子的表示定理。
随着互联网不断延伸和无线接入技术的提高,移动计算设备越来越普及,移动数据库系统也得到越来越广泛的应用,它可以帮助用户随时随地访问信息并作出正确决策.同步复制,即保证