Web图像搜索中的内存索引与融合聚类技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:caiwupim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展和网络带宽的提高,Web上图像资源变的越来越丰富,它们被大量的内嵌在网页中,构成了一个庞大的“Web图像数据库”。Web图像检索致力于解决从纷繁复杂的Web上,帮助用户快速的检索到需要的信息。而目前Web图像检索的瓶颈问题是如何提高检索效率和如何准确的标识图像的语义。基于文本的图像检索(Text-Based Image Retrieval,TBIR)是当前商业图像搜索引擎所采用的主要方式,它面临的主要问题是只利用了Web图像的文本信息来间接地检索图像,没有利用图像本身的内容信息;基于内容的图像检索(Content-Based Image Retrieval,CBIR) 则是当前图像检索学术研究领域的主流方式,它面临着主要问题是“语义鸿沟”的问题,即图像的底层视觉特征不能有效的描述其高层语义。 根据EMD(the Earth Mover’s Distance)算法的近似匹配算法,提出了Web图像的内存索引方法,此方法主要把高维的图像特征降维为一维的加权平均中心,并以此建立平衡二叉搜索树内存索引。并把索引常驻内存,有效的减少了磁盘I/O的访问开销,显著提高了系统的检索速度。通过改进系统的检索模式,提出了全局检索模式。此模式先基于KNN(K-Nearest Neighbor)的范围查找,过滤掉许多对查询结果没有影响的聚类中心,然后EMD算法匹配找到与样例图像最相似的K个聚类中心,能够用更少的时间检索出比分层检索模式更好的查询结果。 针对Web图像的多模特性,提出了基于图像内容和图像文本信息的融合聚类方法。此方法的核心思想是在聚类过程中同时利用Web图像的文本信息和内容特征,实现相互作用或关联以缩小图像的“语义鸿沟”,建立文本
其他文献
随着实时CORBA(Common Object Request Broker Archi tecture,通用对象请求代理体系结构)技术的日趋完善及应用的需求,越来越多的分布式实时系统建立于其之上。在分布式实时系
随着计算机技术的发展,计算机安全事件频繁发生。计算机取证(computer forensics)正是在这种形势下产生和发展的,它可以对犯罪分子产生威慑作用。当前,分布式拒绝服务攻击(DD
应用数据挖掘技术,加强税收数据进行分析,为税务系统强化科学管理提供有价值的决策信息,已经成为当前税务系统的一个研究热点。本文针对当前税收执法管理工作中存在的不足,结合税
随着科学技术的发展,全球信息化时代的全面到来,数字化科技将为未来社会建立起“数字世界新秩序”,数字化信息将成为人类社会的重要支柱之一。在数字全球化的大环境下,传统的档案
随着计算机网络技术和计算机通信技术的迅猛发展,使人们对网络上提供的高质量视频/音频等多媒体服务的需求越来越大。以视频点播(VOD)为核心的各种网络应用和信息服务将成为人们
随着多媒体技术和网络技术的发展,多媒体信息的机密性和真实性越来越受到人们的重视。但是在对数据进行保护的时候往往却忽略了多媒体数据本身的特点,如文件格式、码流结构、
模式识别是一种人工智能信息处理技术,在近年来广泛应用于文字、指纹和遥感图像识别等领域。模式识别大致分为三个过程:预处理、特征提取、识别。预处理完成的是前期工作,对
在计算机网络中存在着大量空闲的存储资源,例如台式机、服务器、工作站等,虽然这些节点的计算与存储能力各异,但都可以向其他节点提供一定的共享存储空间,并且这些节点也可能成为
随着计算机网络技术的迅速发展,计算机网络无所不在地影响着社会的政治、经济、文化、军事等各个方面。大多数的企业、政府部门与机构都在充分利用网络,组建和发展自己的网站来
计算机的广泛应用和Web技术的快速发展使人们进入了互联网时代,为人们的生产生活提供了极大的便利。与此同时,J2EE Web技术的广泛应用,推动厂互联网技术的进步。人们在享受We