基于多标签学习的图像区域语义自动标注算法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户：kaixin314159

【摘要】

：

当今伴随着互联网的迅猛发展,各种不同表现形式、不同内容的图像数据也在以几何数量级的速度激增。面对如此纷繁浩大的图像数据库,如何快速而准确地检索到用户满意的图像结果

【作者】

：

滕舟

【机构】

：

复旦大学

【出处】

：

复旦大学

【发表日期】

：

2011年期

【关键词】

：

图像处理基于内容的图像检索 SIFT 词袋模型最大期望

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当今伴随着互联网的迅猛发展,各种不同表现形式、不同内容的图像数据也在以几何数量级的速度激增。面对如此纷繁浩大的图像数据库,如何快速而准确地检索到用户满意的图像结果,已经成为一个实用并且迫切需要解决的问题。高效的图像检索技术能够极大地有助于人们在互联网上进行数字娱乐,提高人们的生活品质。目前基于网页文本的检索技术相对已经比较成熟,但是Google、百度以及Flickr等公司各种基于图像的检索技术却由于自身的种种缺陷还都远远不能满足用户的需求。当前学术界比较关注的基于内容的图像检索技术主要是考虑通过挖掘图像本身的视觉语义特征进行相关检索。从图像中我们可以提取出颜色、纹理、形状以及关键点等多种多样的视觉特征,然后我们再使用图像的相似度计算或者利用模式识别与机器学习的方法来分析出这些图像所包含的高层语义信息,最后再融合各种其他算法检索出相关的结果。虽然人们采用了很多方法来训练学习图像的检索引擎,相关方面的研究也已有了数十年的发展,但当前基于内容的图像检索技术所达到的性能还不是很理想。一方面主要在于感知鸿沟的存在,利用当前技术提取的视觉特征对图像内容的表达还远远不够,而这些是实现基于内容的图像检索技术的基础,另一方面还在于语义鸿沟,暂时还没有比较好的方法可以统一规范不同的人对同一幅图像的理解表达。因此当前的着眼点还是放在如何更好地提取以及表示图像本身所蕴含的各类特征信息之上,以及如何合理地运用特征信息之间的联系帮我们实现基于内容的图像检索。本文中,我们主要关注在基于多标签学习的图像区域语义自动标注算法研究,其最终目的也是为了提高图像检索的准确率和效率。我们提出了一个基于EM迭代的非监督图像多标签区域标定算法,它能够非常有效地将基于全图的标签自动标定到图像的对应局部区域上。首先我们对所有图像进行SIFT特征点的密集采样,然后将在文本处理领域获得成熟应用的词袋模型类比使用到基于内容的图像分类中,结合对所有的SIFT特征点的K-means聚类获得图像视觉词典,再构造最大期望算法迭代过程计算出每幅图像中每个标签对每个存在图像视觉WORD的置信度,最后选择那些置信度较高的图像视觉WORD,确定每幅图像中每个标签置信度最高的对应区域。实验表明,在样本数据充分的情况下,本文提出的算法在解决非监督自动标定、标签表观的多样性以及多标签等问题上都取得了不错的效果。后续进行的工作将主要关注在改进特征表示的多样性和有效的特征组合方式,从而提高本算法在更多各类标签上的适用性和准确性。最后,我们对未来的基于内容的图像检索技术做出了展望。

其他文献

PSO算法的改进研究及在函数优化中的应用

粒子群优化(ParticleSwarmOptimization,PSO)算法是一种智能优化算法，属于进化计算领域里的新分支。PSO算法结构简单、只有较少的参数需要调整、收敛的速度比较快、不需要梯度

学位

粒子群优化算法全局优化变异算子自适应惯性权重

渤海海洋防灾减灾数据仓库的构建与快速访问技术研究

本文研究了渤海海洋防灾减灾数据仓库构建过程中涉及到的一些关键技术,包括数据仓库设计,OLAP快速访问策略,以及序列OLAP系统设计。关于渤海海洋防灾减灾数据仓库的设计,分别

学位

数据仓库数据集市OLAP序列OLAP防灾减灾

基于GSNI测度的多模态医学图像配准方法研究

在医学临床诊断治疗中,通常需要对病人的病变部位进行多模态成像,来获取互补、有效、全面的信息,以提高医生的诊断治疗效果,这就需要对不同模态的医学图像进行信息融合,将多

学位

医学图像配准互信息SNI信息梯度信息

基于禁忌搜索算法的EFSM测试数据生成

随着计算机软件行业迅速发展,需求日益复杂,软件产品质量的提高变得越来越重要,已成为人们关注的焦点。软件测试是保证软件质量最重要的手段,也逐渐成为软件开发过程的重要阶

学位

禁忌搜索遗传算法可扩展有限状态机测试数据生成禁忌表

基于内容的中草药图像检索关键技术研究

基于内容的中草药植物图像检索,是基于内容的图像检索技术在中草药植物检索领域的应用,其目的是通过将中草药植物图像的视觉特征与数据库的特征数据进行比较,得出符合相似度

学位

中药草植物图像检索多特征融合卷积神经网络

视频运动目标检测若干关键算法研究

智能视频监控是计算机视觉领域新兴的一个前沿课题,与传统的视频监控系统相比,智能监控系统的监控能力强、耗费人力少、稳定性好、安全隐患少、准确性以及实时性都有明显的提

学位

运动目标检测滤波算法混合高斯模型阴影检测

基于XMPP协议的移动设备无障碍实时方位共享系统的研究与实现

2015年第二季度,中国电子信息产业发展研究院发布了旨在全面梳理总结移动设备产业现状的《移动智能终端产业发展白皮书(2015版)》。文中指出,过去一年移动智能终端产业在全球

学位

位置共享XMPP协议无障碍语音提示加密传输

基于情感的多标签个性化音乐分类技术的研究与实现

在线音乐的快速发展,为用户对音乐的获取提供了极大的便利。为了方便用户选择,在线音乐通常会对音乐进行分类,基于情感的音乐分类是常见的一种分类方式。由于同一首音乐可能

学位

在线音乐情感类别多标签社交信息个性化分类

基于N-gram模型的查询纠错技术的研究

查询纠错属于自然语言处理研究的一方面,随着检索系统(如谷歌、百度、新浪、搜狗等)检索访问量不断增加,查询纠错处理技术受到越来越多的关注。在实际的应用中,用户进行查询

学位

查询纠错动态规划哈希索引相似匹配N元语法统计模型

分簇无线传感器网络中基于LEACH路由协议的跨层节能技术研究

节能是无线传感器网络(WSNs)设计者首要考虑的问题。节点分簇组网方法和网络跨层设计方法是无线传感器网络提高网络性能的技术。本文基于LEACH路由协议进行跨层设计,专门研究

学位

无线传感器网络路由协议LEACH协议跨层节能技术非线性电池模型

基于多标签学习的图像区域语义自动标注算法研究

其他学术论文