论文部分内容阅读
图像含有比文本更为丰富的信息,在人们日常生活中发挥着重要作用。近年来由于因特网技术的发展及各种消费型电子产品的普及,每天都有巨量的数字图像产生和发布。在多媒体数据库中快速、有效地寻找所需要的图像是一个非常有意义的课题。目前工业界的许多图像搜索引擎(如GoogleTM和百度TM)在搜索图像时并没有按照图像内容本身来搜索,而是根据与图像相关联的文字信息来完成搜索任务。导致搜索结果不尽如人意。基于内容的图像检索是有望解决这一问题的关键技术。本文对这一技术中的几个问题进行了研究,取得了如下结果:纹理特征是图像检索中广泛使用的重要底层视觉特征。本文将图像纹理视为非线性动力系统产生的信号,使用2种非线性信号分析方法-复杂性方法和希尔伯特-黄变换(HHT)方法来提取图像的纹理特征并将之用于纹理图像检索。得出的结果有:(1)将时间序列复杂性方法用于图像纹理分析与检索。所做的工作和得到的结论是:比较了8种时间序列复杂性方法用于图像检索时的性能,发现基于符号动力学和基于熵的方法不适于图像检索;基于频谱分析的CO复杂性特征适于图像检索,该特征的检索性能与二维图像一维化的扫描方法有关;实验表明采用Hilbert扫描方式的CO复杂性特征在Brodatz纹理库上取得了和Gabor特征极为接近的检索结果,计算特征所需要的时间比Gabor特征少了一个数量级;由图像阈值化算法得到启发,提出了一个新的一维时间序列粗粒化框架;提出了多种基于二维CO复杂性测度的纹理特征:复杂度直方图和多尺度复杂度直方图、复杂度共生矩阵、复杂度纹理谱和多尺度复杂性特征;实验表明基于金字塔分解的多尺度复杂性特征在不同的实验图像库上检索性能稳定,是一种较好的纹理特征;(2)将希尔伯特-黄变换方法用于图像纹理分析与检索,所做的工作和得到的结论是:提出了一种新的基于聚类的边界处理算法以改善经验模式分解(EMD)方法所产生的边界效应问题;使用二维Hilbert变换计算了内禀模态函数(IMF)的幅值作为检索用的图像纹理特征。实验表明,提出的HHT特征可以取得和Gabor特征较为接近的图像检索结果。图像的显著性区域是表达图像语义的主要部分。本文尝试使用一个基于视觉生理和心理物理实验基础的选择性视觉注意计算模型用于自然图像检索的研究。所做的工作和得到的结果是:(1)使用视觉注意计算模型计算了图像中的兴趣点并提取兴趣点周围的局部特征用于图像检索。提出的检索特征有图像的显著性直方图特征、图像的显著性标签和注意焦点(FOA)空间关系直方图特征。实验结果表明显著性标签和FOA空间关系混合编码的直方图特征可以取得比全局直方图特征更好的检索结果;在采用视觉注意计算模型计算得到的图像显著性区域上提取的一些区域特征可以取得比全局特征更好的检索结果;(2)提出了将潜在语义标引方法和视觉注意计算模型结合起来用于自然图像检索的方法;(3)提出了在多示例学习框架下基于视觉注意计算模型和JSEG图像分割算法的包生成器方法,并将其用于自然图像检索。图像检索实验表明基于JSEG分割算法的包生成器取得了比一些文献中提出的包生成器更好的实验结果。本文提出了“图像语义阈值”的新概念及其度量方法。通过计算机实验和心理物理学实验初步得到如下结论:在自然图像认知或理解时存在一个语义阈值;可以通过图像的图像熵和图像分维数及类似Weber律的方法来度量该阈值;差别阈限图像及其原始图像的度量值的比值与图像语义内容无关,而和色彩模式(彩色或灰度)及图像的变换方法相关。本文作者还设计与开发成功了一个图像检索实验平台。使用该平台方便了研究者进行图像检索实验研究,提高了工作效率,便于他们之间进行学术交流。这项工作具有一定的应用价值。