论文部分内容阅读
伴随着网络技术的高速发展,人类进入了信息化与智能化的时代。网络技术的迅速普及使得每天都有大量的数字图像通过各种渠道不断的涌现出来,数字图像是视觉信息的重要载体,对所表达的信息更准确直观,面对如此海量的图片数据,要快速准确地找到自己感兴趣的图片变得越来越困难。因此,图像分类技术引起了研究者的广泛关注,成为模式识别和计算机视觉领域最重要的研究内容之一。在众多图像分类模型中应用较为广泛的当属空间金字塔模型,空间金字塔模型将图像逐层分割成更加精细的空间子区域,然后分别计算其子区域中的局部特征直方图,在图像分类中表现出了稳定的性能。鉴于空间金字塔模型的诸多优势,本文基于此模型基本框架对图像分类阶段的字典学习、特征编码及其相关算法进行研究,主要内容如下:(1)对稀疏编码算法做了深入的文献研究,考虑到弹性网编码方式相对于传统稀疏编码方式的优点,本文提出将弹性网算法与空间金字塔模型相结合应用于图像分类,取得了较好的分类效果。(2)提出了非负弹性网稀疏编码算法。分析比较了非负稀疏编码算法和弹性网算法两者的特点,在弹性网模型中增加了编码系数的非负约束。相对于弹性网算法,该算法不仅能增加编码系数的判别性和有效性,并且可以使相似的特征描述符编码后仍然相似,增加了编码系数的稳定性。(3)将所提算法与空间金字塔模型相结合应用于图像分类,最终的实验结果表明,相对于弹性网算法和传统的稀疏编码算法,该算法具有较高的分类准确度。本文的实验部分主要是基于空间金字塔模型的基本框架完成的,在特征提取阶段使用LibSVM Package开发包。为了验证所提出的算法的有效性,我们在经典的图像分类数据集Caltech-101,Caltech-256,Scene-15,UIUC-Sports上做了大量的实验,实验结果表明,本文所提出的基于非负弹性网稀疏编码算法的图像分类模型具有较高的分类准确率。