图像检索中的浅语义鸿沟词库构建方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：kxdn01

【摘要】

：

近年来,图像检索成为多媒体信息检索领域的重要研究课题。“语义鸿沟”,即用户从视觉数据中提取的信息和用户自身对视觉数据的理解之间的不一致性,是图像检索中一个根深蒂固

【作者】

：

刘洁敏

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2010年期

【关键词】

：

图像检索语义鸿沟浅语义鸿沟词库仿射传播聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,图像检索成为多媒体信息检索领域的重要研究课题。“语义鸿沟”,即用户从视觉数据中提取的信息和用户自身对视觉数据的理解之间的不一致性,是图像检索中一个根深蒂固的问题。在基于语义的图像检索技术中,通过物体识别或者自动标注等建立有效语义概念模型都是为了缩短语义鸿沟。定义一个良好的语义概念库是这些方法中数据搜集、模型建立的第一步也是极为关键的一步。语义概念所固有的语义鸿沟不尽相同,目前的信息处理与图像理解方法还远远达不到提取图像中抽象(深层)语义的要求。更现实的途径是设法找出那些计算机容易学习的具有较浅语义鸿沟的语义概念,这些语义概念更有助于概念检测模型的训练,继而进行语义的识别及自动标注。因此,找出浅语义鸿沟词库对于基于语义的图像检索技术有着重要的意义,其涉及到两个主要问题:1)如何定义浅语义鸿沟的“浅”,也就是说如何有效地衡量语义鸿沟?2)如何自动找出此类语义?本课题所做的工作就是创新性地解决这两个问题,最终构建浅语义鸿沟词库,该语义词库能在研究大规模图像检索时的数据搜集、特征选择、构建检索模型、图像标注等方面提供有用的建议。本文首先阐述了构建浅语义鸿沟词库的基本框架:1)对240万幅互联网图像提取语义文本特征以及多种低层视觉特征,分别建立有效索引。2)在不同的语义鸿沟模型下,对每一幅图片计算其视觉-文本置信度,也就是衡量该图像及其近邻在视觉特征空间和文本特征空间下两种分布的一致性。3)利用仿射传播聚类算法对具有最高视觉-文本置信度的图像进行聚类。4)从聚类结果中进行基于文本内容的关键词提取工作,相关度最高的关键词则是最具有浅语义鸿沟的语义概念。针对不同视觉空间下语义鸿沟不同的情况,本文从多个低层视觉空间出发,分别基于颜色特征、纹理特征以及颜色纹理综合特征,构建了对应的浅语义鸿沟词表。比较分析其异同点,得到基于视觉特征的浅语义鸿沟词库,它能为图像检索中语义概念的特征选择提供有效的建议。针对图像在视觉空间和文本空间的分布不一致性,本文提出了两种对偶的语义鸿沟模型——文本扩散模型和视觉扩散模型。从本质上来说,两种语义鸿沟模型分别对应于基于视觉内容的检索方式和基于文本内容的检索方式。综合由两种模型得到的浅语义鸿沟词库能为语义概念选择合适的检索方式,并能应用于图像标注的优化。本文提出了采用仿射传播聚类算法解决大规模图像聚类问题。该聚类算法有四大优点:1)无需事先确定聚类的类别数。2)要求的输入是相似性矩阵。对于需要同时考虑视觉和文本两重相似性的图像聚类来说,利用相似性矩阵比利用高维数据点更合理有效。3)亦适用于两图像间相似性不对称的情况。4)能有效处理大规模数据集。大量的实验数据充分表明:在本文构建的浅语义鸿沟词库中,各个浅语义鸿沟词表相互独立相互补充,在大规模图像检索研究中的数据搜集、低层特征选择、有效检索方式选择以及图像标注等环节均起到了重要作用,为基于语义的图像检索技术的发展提供了新的思路。

其他文献

基于电视图像信号的外辐射源雷达信号处理方法研究

外辐射源雷达是指自身不发射电磁波而是通过接收空中目标反射的外界辐射源的散射回波来确定目标的位置等信息的雷达系统。利用商用外辐射源如电台、电视台的双/多基地雷达系

学位

外辐射源模拟电视图像信号失配滤波扩展卡尔曼滤波跟踪

保证视频通信质量的选择重传技术研究与实现

随着视频压缩技术的不断发展,通过利用帧间时间相关性和图像空间相关性获得高效压缩,提高了传输效率,但压缩码流受误码的影响非常大。同时,网络环境的带宽条件、分组丢失率或

学位

视频通信选择性重传重传控制混合选择性重传

复杂环境下基于UWB/IMU联合定位与导航

复杂环境下,定位信号的严重衰减甚至中断,会导致定位精度降低甚至定位失败。单一种类传感器的定位方法无法从根本上解决这一问题,而结合各种传感器的优势进行联合定位,是一种

学位

超宽带误差消除IMU联合定位扩展卡尔曼滤波

高动态DS/FH混合扩频通信关键技术研究及FPGA设计

高空平台在军事通信中有着重要的应用价值,特别适合高动态应用。本文在深入研究DS/FH混合扩频通信系统原理的基础上,重点研究了高动态条件下DS/FH混合扩频通信系统的关键技术

学位

DS/FH高动态同步多用户FPGA设计

基于卷积LDPC码的编码协作研究

随着各种智能终端的普及,智慧城市、智能交通等概念的提出,以及互联网、无人机等产业的快速发展,对移动通信网的网络容量和传输速率提出更高要求,使得目前的4G通信网面临巨大

学位

协作通信编码协作卷积LDPC码空时传输凿孔

极化码简化编译码算法及其在MIMO系统的应用

全球无线通信领域的研究热点已转向面向2020年及更远未来需求的第五代移动通信系统(5G)。5G将在更广阔的时空环境下融入更多的领域,最终实现“信息随心至,万物触手及”的愿景

学位

极化码SC译码BP译码空时编码

MIMO-OFDM系统时频域同步技术研究

本文主要研究高速移动信道下,MIMO-OFDM系统接收机载波频率与符号定时同步关键技术。论文首先简要介绍了MIMO-OFDM技术的发展概况,阐述了OFDM传输技术的基本思想和数学原理以

学位

多输入多输出正交频分复用TD-LTE符号定时同步载波频率同步

多模态医学影像融合方法研究

多模态医学影像融合指将不同模态的影像融合在一起,目的在于充分显示形态成像方法的分辨率高、定位准确这一优势,克服功能成像中空间分辨率和组织对比分辨率低的缺点,最大限

学位

多小波变换模糊推理D-S证据理论医学影像融合

图像检索中的浅语义鸿沟词库构建方法研究

其他学术论文