论文部分内容阅读
自20世纪70年代以来,图像检索就已经成为了一个非常活跃的研究方向,并逐渐形成了两种主流的检索技术研究方向:基于文本的图像检索和基于内容的图像检索。但是图像底层特征与图像表达的高层语义之间存在着“语义鸿沟”问题,这两种检索技术并不能跨越这种鸿沟,无法满足人们对图像检索的需求。因此不少专家学者致力于研究如何建立起图像底层特征到高层语义之间的映射,跨越这道鸿沟。本文在对基于语义的图像检索系统框架的研究上,对系统的基础技术进行了研究,采用基于图像分类的语义映射方法,利用视觉语义空间模型表示图像,实现图像的语义标注和检索。在前人的研究基础上,本文主要做出了以下贡献:①提出了使用图像区块的位置特征用于标注采用自适应的方式对图像进行分割后,图片的区域中存在着很多底层特征相近,但表达的高层语义却不同的区域。因此在提取图像底层特征时,引入了图像位置特征,通过聚类的方式自动的挖掘出他们的位置信息。②提出了加权的视觉语义空间映射方法在文本处理的时候,会通过对每个字词在文中出现的频率来作为加权值,计算它对文章主题的贡献。在图像中,不同大小的区域对图像语义的表达同样有着不同的贡献,因此引入了区域占整幅图片的面积大小来作为它投影的加权值。③提出了基于支持向量机的图片语义分类与标注方法,并利用到分类面的距离计算图片的索引值支持向量机的图像分类结果只有两个,+1和-1(即属于或不属于该类)。但每个样本与支持向量机的分类面之间都有一个距离,本文利用这个距离,取与它趋势相同的函数来作为图片对语义类的隶属程度,作为图片的索引值。④完成了语义图像标注原型系统的开发和实验验证最后,本文对以上提出的方法开发实现了一个语义图像标注原型系统,并进行了实验验证。实验表明:(1)在引入了位置作为区块的特征后,对含有底层特征相似但高层语义不同区域的图像有着不错的区分能力。(2)提出的加权映射算法,使得图片中的语义提取更加突出重点。(3)利用样本与SVM分类面的距离计算图片的索引值,可以对相关图片进行合理的排序。本文提出的基于语义的图像检索方法,可用于多媒体图片库的管理和检索,图片搜索等。对当前研究和应用领域,有一定的学术和应用参考价值。