论文部分内容阅读
在当今多媒体技术时代,大量的图像信息充斥着网络。如何快速、有效地查询具有丰富内容的彩色图像已经成为学术界的研究热点,基于内容的图像检索技术(CBIR)应运而生。由于人类感知的模糊性,面向用户的图像检索应该符合人脑的思维方式。模糊数学正是模拟人脑思维的有力工具,因此本文采用模糊数学的思想来对图像检索进行分析、研究和实现。
本文首先分析了特征提取、相似性度量等图像检索的关键技术,然后介绍模糊数学理论的基本原理,随后,探讨了基于模糊理论的图像检索算法,并予以实现,实验结果证实了文中算法的正确性和有效性。本文的主要工作概括如下:
1.采用一种新的颜色直方图以及相似性度量的表示方法,克服了传统直方图的不足。首先,采用基于MPEG-7视觉内容的颜色作为相似颜色区域内的特征值,对像素颜色值进行非均匀的量化之后,计算每一种颜色出现的概率,并抽取主要颜色特征作为特征向量存储在图像数据库中。最后,根据模糊集合理论的一种距离函数可计算出颜色直方图的相似度。
2.引入模糊汉明距离这一理论,它是汉明距离在模糊理论的扩展,兼顾了特征值(此文中为颜色)的不同以及相异的程度。在对图像分块处理后,提取图像块的HSV颜色分量,使用模糊汉明距离计算查询图像与库图像之间的相似性度量。该检索算法应用于Corel专业图像库,较好的解决了图像的低层特征和高层语义难以逾越的鸿沟这一难题。与Ruofei Zhang等的FUZZYCLUB系统相比较,本算法更为优越。
3.图像颜色量化过程中,处在量化边界的颜色存在模糊性。据此,本文采用了HSI颜色空间的隶属度函数来描述颜色。同时,加入了模糊子集内颜色的位置分布特征和离散度特征来表示颜色的空间信息。基于纹理也是描述图像的重要信息,本文提取了经典的灰度共生矩阵。最后,综合颜色直方图、颜色空间信息以及纹理特征进行图像检索。
4.针对颜色直方图只能反映颜色统计特征这一点,引入了经典的特征描述符,从颜色、纹理、边缘和空间四个方面提取直方图,并把模糊汉明距离(FHD)理论应用于相似性度量。我们选取专业图库Corel中的1000张图片进行实验,取得了较为满意的实验结果。