论文部分内容阅读
随着图像信息技术和图像采集工具的飞速发展,图像信息呈现指数级爆炸性增长,可以说人们的生活无时不刻的充斥着各种各样的信息和数据,此时图像分类和图像聚类问题在现实生活中就体现出了广泛的应用价值和研究前景。然而,这些海量图像信息往往表现出数据量极大、维数过高、结构非线性化等特点,这使得我们很难对图像数据进行有效地处理。经过学者们对图像数据的多年研究,他们发现了一个有趣的规律,尽管图像数据在数学模型中的表现是高维的,然而其本质是具有很低的特征维数。因此,为了从海量的数据中挖掘出图像数据间的本质规律和内在联系,需要把高维数据投影到低维的子空间,进而学习数据间所隐含的语义信息。而矩阵分解恰好就是这样一种行之有效的降维方式,通过矩阵分解可以得到投影基矩阵和对应的低维子空间表示。本文针对图像分类和聚类的目的,结合了非负矩阵分解理论与流形学习理论及稀疏编码思想,提出了图规则化和稀疏编码的非负矩阵分解(GRNMF_SC)算法,以期兼顾图像数据的内蕴几何结构以及编码矩阵的稀疏性,获取最优的低维图像表达。另外,本文还立足在众多学者在矩阵分解上的研究进程,首次提出了“理想矩阵分解”的概念,并创造性地提出了一种满足“理想矩阵分解”标准的,更为新颖的稀疏概念的判别矩阵分解(SDMF)算法。SDMF矩阵分解是一种很灵活的矩阵分解思路,其近fisher准则的设计不仅能够使得学习到的基底能够捕获跨特征空间的判别信息,同时还能保持数据内蕴几何结构。而且,近fisher准则更是考虑了类别信息缺失情况下的鉴别分析,因此SDMF可以针对图像分类和图像聚类任务实现为监督版本的SDMF (S-SDMF)和非监督版本的SDMF (U-SDMF)。SDMF相较于GRNMF SC,在识别和聚类精度,以及算法实时性上均有了较大提升。