论文部分内容阅读
随着Internet的普及和发展,图像数据飞速膨胀,如何高效、快速地检索到所需的图像成为当前图像应用领域的一个研究热点。由于图像数据自身所具有的非结构化特性和内容多义性等特点,传统的基于关键词的检索已不能满足对图像数据的管理和检索。为了便于图像的检索和识别,基于内容的图像检索技术应运而生,它融合了图像处理、图像识别和图像数据库等领域的技术成果,从而可以提供更有效的检索手段。考虑到本文的研究目标是为文本图像中的图标检索提供理论基础和技术支持,在详细分析了图像检索关键技术的基础上,本文深入研究了基于内容的二值图像检索,主要完成了以下工作;1、分析了颜色和纹理特征的提取技术和相似性度量方法,实现了综合颜色和纹理特征的图像检索。主颜色特征侧重于图像整体信息的描述,边缘直方图则描述了局部信息,综合这两种特征进行检索可以达到优势互补的效果。2、研究了基于轮廓特征和基于区域特征的形状检索,深入讨论了傅立叶描述符、几何不变矩、正交矩(Zernike矩、伪Zernike矩、Legendre矩)的提取方法,实现了基于这五种形状特征进行图像检索的方法,分析比较了它们的检索性能。3、提出了一种基于区域的形状特征——密度分布特征,它能够反映图像中目标像素的空间分布信息。在经过形心定位和子图像区域划分后,可得到两个M维特征向量,第一个表示各个子图像区域的目标像素的相对密度,第二个表示各个子图像区域的目标像素在极坐标方向上的相对密度的一阶数值差分。在相似性度量时,首先采用Gaussian模型对这两个特征向量计算得到的距离分别进行归一化处理,然后综合两个特征向量的距离计算总的相似度。实验结果表明,密度分布特征能够有效地刻画二值图像的形状,具有非常好的平移、尺度和旋转不变性,而且,检索性能优于Hu不变矩。4、研究了检索系统的优化方法,实现了K均值聚类和遗传算法聚类方法,并对索引库进行聚类处理;本文引入K均值聚类对检索结果图像进行筛选,实验证明了其提高了检索的准确率。5、研究了相关反馈技术,实现了基于特征权重调整的相关反馈算法。用户可以根据相关反馈动态地调整图像特征的权重以改善检索精度,从而使检索结果更加符合用户的需要。