论文部分内容阅读
随着计算机技术的发展和网络带宽的提高,Web上图像资源变的越来越丰富,它们被大量的内嵌在网页中,构成了一个庞大的“Web图像数据库”。Web图像检索致力于解决从纷繁复杂的Web上,帮助用户快速的检索到需要的信息。而目前Web图像检索的瓶颈问题是如何提高检索效率和如何准确的标识图像的语义。基于文本的图像检索(Text-Based Image Retrieval,TBIR)是当前商业图像搜索引擎所采用的主要方式,它面临的主要问题是只利用了Web图像的文本信息来间接地检索图像,没有利用图像本身的内容信息;基于内容的图像检索(Content-Based Image Retrieval,CBIR) 则是当前图像检索学术研究领域的主流方式,它面临着主要问题是“语义鸿沟”的问题,即图像的底层视觉特征不能有效的描述其高层语义。
根据EMD(the Earth Mover’s Distance)算法的近似匹配算法,提出了Web图像的内存索引方法,此方法主要把高维的图像特征降维为一维的加权平均中心,并以此建立平衡二叉搜索树内存索引。并把索引常驻内存,有效的减少了磁盘I/O的访问开销,显著提高了系统的检索速度。通过改进系统的检索模式,提出了全局检索模式。此模式先基于KNN(K-Nearest Neighbor)的范围查找,过滤掉许多对查询结果没有影响的聚类中心,然后EMD算法匹配找到与样例图像最相似的K个聚类中心,能够用更少的时间检索出比分层检索模式更好的查询结果。
针对Web图像的多模特性,提出了基于图像内容和图像文本信息的融合聚类方法。此方法的核心思想是在聚类过程中同时利用Web图像的文本信息和内容特征,实现相互作用或关联以缩小图像的“语义鸿沟”,建立文本