论文部分内容阅读
随着社会的不断进步,计算机技术、互联网技术等不断发展,数据也越来越丰富和复杂,针对丰富且复杂的数据进行聚类分析的重要方向也越来越受到人们的关注,高维数据聚类更是重点研究的领域。高维数据所带来的“维灾”,使得本来在低维数据上聚类可取得良好效果的方法不能取得好的聚类效果,从而提出了针对高维数据的聚类方法,主要分为维度约减和子空间方法。由于维度约减的方法无法保证不损失原始数据的信息,基于子空间的方法称为高维数据聚类的重要研究方向。子空间聚类方法有许多基于搜索的方法,比如CLIQUE、PROCLU等,都是基于某种搜索策略,在子空间中搜索类簇,但是由于数据分布的密度往往是不一致的,基于搜索的方法往往得不到理想的结果。本文重点研究稀疏子空间聚类方法,其基于数据的自表达性,利用解决稀疏优化问题,将高维数据聚类问题转化为对图的划分问题,基于图的划分原理,采用谱聚类思想,将图划分为几个连通分量,达到聚类的目的,具有比较好的鲁棒性。本文首先介绍了一些经典的聚类方法、针对高维数据聚类的相关方法以及经典的子空间聚类方法。然后重点研究了稀疏子空间聚类算法的基础理论及其整个算法流程。然后给出了针对经典稀疏子空间聚类方法的两点改进。最后基于LBP的相关方法提取图像特征,将改进的稀疏子空间聚类方法解决纹理图像和人脸图像聚类问题。本文的主要工作和创新点如下:1、基于非对称拉普拉斯矩阵rwL改进稀疏子空间(SSC)聚类算法。利用非对称拉普拉斯矩阵rwL对经典稀疏子空间聚类方法进行了改进,减少了SSC的时间复杂度,提高了聚类的速度。2、基于权值矩阵预设K-means聚类初始聚类中心,改进稀疏子空间聚类算法。基于解稀疏优化问题后得到的权值矩阵W的性质,在稀疏子空间聚类的最后利用K-means方法时,设置相对合理的初始聚类中心,可以防止K-means方法聚类时陷入局部最优或者结果不稳定,提高了聚类的准确率。3、给出一种了利用多尺度LBP旋转不变模式和稀疏子空间聚类算法的纹理图像聚类方法。该方法首先利用多尺度LBP旋转不变算子获得高维的纹理图像特征。然后采用本文改进的SSC对得到的高维特征集进行聚类。该方法中提出取的纹理图像高维特征包含了丰富的纹理特征信息,且同一个类的纹理特征接近位于同一个线性子空间中,利用改进的SSC对其进行聚类能够得到比较理想的聚类结果。4、提出基于人脸分块的LBP等价模式和稀疏子空间聚类算法的人脸图像聚类方法。该方法首先利用LBP等价模式独立计算每个人脸图像块的纹理特征,然后融合所有图像块的文理特征,得到高维的人脸图像全局特征,该高维特征向量即包含了丰富的局部纹理特征又兼顾了人脸图像的空间和方向信息。最后通过本文所提出改进SSC对特征集进行聚类,能够取得比较好的聚类结果。