论文部分内容阅读
随着信息科学和互联网技术的快速发展,人们可以容易地获取大量的图像信息。但由于图像数量很大,人工用肉眼来分析图像内容变得不现实。为了自动分析图像内容,必须采用基于计算机视觉和模式识别的图像分割和分类。由于图像分割和分类可以用聚类算法完成,本论文重点研究基于聚类的图像分割和分类算法。图像分类中至关重要的第一步就是图像表示。基于视觉词汇的图像表示是图像表示的主流方法之一,因此视觉词汇构造的优劣直接影响图像分类效果。构造视觉词汇常用k-means聚类算法。k-means聚类通常采用欧氏距离作为距离度量方法,但由于高维空间数据存在噪声且具有稀疏性,使得聚类效果显著降低,影响图像的表达。针对上述聚类过程中构建视觉词汇存在的问题,本文提出了解决该问题的方法。该算法将欧氏距离和一种适用于高维空间相似性度量的方法相结合,作为k-means聚类算法中的的相似度量。在场景数据库和Caltech-101数据库上的图像分类实验结果表明,使用此聚类算法构造视觉直方图,能够显著的提高图像分类正确率。为了进一步提高图像分类的效果,Yang等提出了稀疏编码替换聚类中常使用的向量量化方法,减少了量化过程中的错误率,为图像提供了更好的图像表示方法,并能够在图像的训练和分类过程中使用线性的分类器。为了解决图像特征维度高影响计算的速度的问题,本文在稀疏编码的基础上加入了主成分分析的降维方法,将进行稀疏编码的图像特征维度降低一倍多,在不影响图像分类的效果的前提下,提高了图像分类的速度。基于谱聚类算法的图像分割一直是图像分割领域颇受关注的研究课题,本文在规范化的图像分割的基础上,介绍了一种加入偏置条件的图像分割算法,此算法能够在人为干预的情况下对感兴趣区域进行有效地分割。