论文部分内容阅读
随着图像获取设备和存储设备的普及、互联网技术的飞速发展,图像信息在人们工作生活的各个方面扮演者越来越重要的作用。传统的类似文本标签方式的图像检索较难满足图像准确检索的需求。基于内容的图像检索技术已逐步成为图像检索的主流。如何在允许的范围内迅速有效地查询到自己需要的图像已成为多媒体技术研究领域关注的焦点。综合多特征的图像检索(IMFIR)是目前基于内容的图像检索(CBIR)的研究热点,本文分别提出基于非线性模糊直方图、颜色及纹理布局特征和ROI与SIFT相结合的的IMFIR算法,实验表明,IMFIR方法比基于单一特征的图像检索性能更好。本文主要工作如下:1.本文分析了基于内容的图像检索系统涉及的CBIR系统架构、特征提取、检索性能评价等6类相关技术;对颜色、纹理和形状三类图像特征的几种常见提取方法进行了实现。2.依据人眼视觉感知的特性,在分析颜色直方图和梯度向量直方图的基础上,提出了基于非线性模糊化的颜色直方图和梯度向量直方图,然后结合相关反馈的原理优化选取特征组组合构建基于非线性模糊直方图的IMFIR算法。3.在综合分析图像颜色分布和纹理布局特征的基础上,首先将原图像在RGB颜色空间进行均匀量化,把量化后图像的多纹理素直方图作为标识图像的纹理布局的特征;再把原图像转换到CIE L*a*b*颜色空间并量化,提取量化图像的颜色聚合向量作为另一组特征,最后借鉴文本检索中的词加权和相关反馈方法的原理,采用经验参数调节的方法不断修正两组特征测量值的权值完成基于颜色和纹理布局的IMFIR算法。4.在分析感兴趣区(ROI)和尺度不变的特征变换(SIFT)的基础上,提出先在熵图像中提取ROI,再计算ROI的Zernike矩值缩小初选检索图像集,最后用SIFT进行高准确度的匹配或检索的IMFIR算法。该算法适用于窄领域的专业性检索,它涉及的参数较多,文中采用相关反馈法不断地学习和调整这些参数。通过检索图像集验证综合多特征能更客观全面地标识图像,相关反馈原理能较有效地弥合图像特征与视觉感知的差异,这些对于构建实际的图像检索系统具有重要的意义。