基于标签语义的图像检索算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mavylin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和计算机技术的快速发展,网络中的图像数据爆炸式增长。如何对海量的图像数据进行有效的存储、管理和应用具有非常重要的意义。近年来,各种基于图像的应用场景的出现,对包括图像检索在内的计算机视觉领域的算法提出了巨大的挑战。现有的图像检索算法在MNIST手写体数字识别、CIFAR等特定的图像数据集上有不错的模型表现,但是当图像场景复杂多样时,这些算法的检索性能却受到很大的限制。图像检索最大的难点在于如何减小图像底层视觉特征与用户高层语义之间的语义间隔,从而获得满足用户需求的图像。为了提高和改进图像检索算法的性能,本文主要开展了三方面的工作:第一,为了提高图像检索的效率,在检索之前通常需要对图像数据集进行分类,因此,本文提出了一种基于隐因子模型的图像分类算法。该算法在预处理的形式化图像特征和监督信息的基础上,通过隐因子模型学习图像特征和类别之间潜在的语义关联,将图像分类问题转换成隐因子模型的语义特征学习问题。模型不仅充分利用了隐因子模型在隐含语义学习方面的优越性,根据数据内在的特性自动学习图像特征和高层类别语义之间的联系;而且比深度学习具有更高的学习效率,使模型具有更广泛的适用场景。在两个图像分类场景下的实验结果验证了该算法的有效性。第二,为了使模型获得更丰富的语义监督信息,本文提出了一种基于语义图的深度多标签图像检索算法。该算法基于协同过滤和标签聚类的思想学习图像多标签信息之间的语义关联,生成图像的语义监督特征;再基于卷积神经网络构建深度哈希模型学习图像的哈希码和特征向量,以此实现快速高效的图像检索。该算法充分挖掘了隐含在图像多标签数据中丰富的用户先验知识,使模型获得了更有效的监督信息;而且网络模型建立在现有工作的基础上,确保了网络在图像特征提取和哈希学习时的有效性。在基准图像数据集上的实验结果表明该算法的检索表现优于现有的模型。第三,考虑到相关工作在语义排序表示上的不足,本文提出了一种基于语义排序的图像检索算法。该算法通过最小化图像哈希码相似度和语义相似度之间的距离构建优化模型,并基于模型的最优解学习图像高维特征和低维哈希码之间的语义映射和潜在关联。该模型以哈希码之间的欧式距离表示汉明距离的策略比现有工作中用内积计算的方法更加合理有效;而且,该算法通过自然语言处理模型Word2Vec学习不同类别之间的语义差异,使模型获得更丰富的语义监督信息。最后,本文通过对比实验验证了该算法在不同图像检索场景下的有效性。
其他文献
<正>2011年10月,中共中央十七届六中全会公布了"关于推动社会主义文化大发展大繁荣若干重大问题"的决定,全面部署了文化兴国战略。中国城市和乡村如何在新型城市化进程中传承
随着科技的不断发展,无人机(Unmanned Aerial Vehicle,UAV)的应用日益广泛,其功能也越来越复杂,因而对无人机的硬件与软件系统的要求也越来越高。作为无人机软件系统的核心,
国家十九大报告中指出,乡村振兴战略其中最为重要的一项措施极为对乡村人居环境的改善与对老年特殊群体的关怀。然而,我国乡村人口结构老龄化的趋势日益严峻,在空巢老人、城
阐述了基于数字化工厂的设备环境建模、面向数字化加工的过程建模和数字制造系统的信息建模等理论问题,为系统地描述整个数字制造系统提供了新的思路和方法.
高空间分辨率的遥感影像可以在精细的空间尺度上对地表生物物理参量进行研究,但目前的遥感卫星及其传感器难以做到同时保有高空间分辨率和高时间分辨率的特点。近年来发展起
目的:观察饮食护理在老年H型高血压患者的应用效果。方法选取2014年12月~2015年12月我院收治的H型高血压患者55例纳入研究组,给予饮食护理,选取同期入院的健康体检的老年人30名纳
土地价格是提前支付的土地地租,就因果关系而言,是房价高增加了对土地的需求而导致地价上涨,地价的高低与否是房价高低的结果,不是房价高低的原因。——题记 The land price
音乐思维作为人类的精神产物和智慧结晶,以其独有的情感渗透力以及结构形式中的高度逻辑性,完全不同于人类以语言为基本材料的抽象思维。它产生于主体心灵对客观世界的生命体验
数学社团活动一般通过"选定主题、讨论内容、合作研究、社团交流、形成报告"等步骤开展活动。选择合适的主题是活动能否取得理想效果的关键。在多年的社团活动中发现,引导学
结合江苏的发展阶段和实践探索,从空间特色、建筑品质、园林艺术三位一体联动的角度,系统地提出了城乡空间品质提升的总体思路和工作方略,旨在城市化转型发展期率先探索提升