基于弱监督深度学习的图像检索方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:napone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索一直是学术界的研究热点问题。其核心问题是,如何让计算机像人一样准确地理解图像的含义。近年来,深度学习技术在图像上的应用取得了瞩目的成绩,涌现出一批基于内容的图像检索(CBIR)系统,如百度识图等。“卷积神经网络+哈希学习”已成为解决图像检索最有效的方法之一。然而,现有的系统(如百度识图)多采用有监督学习训练神经网络,以高昂的人力标注成本换取神经网络的优异表现。另外,传统的无监督学习技术不能很好地反应图像高层次语义信息,因此较少被图像检索模型采用。随着移动互联网的快速发展,如果能够利用大规模用户主导产生的弱标注数据实现图像检索将会节约大量人力标注成本。但是,尽管弱标签数据含有图像的语义信息,其中仍存在非视觉性语义标签和标签含义模糊(同义词、一词多义)等问题。本文提出一套弱监督学习框架,利用用户产生的弱标注信息训练神经网络。具体步骤如下:一、本文使用词袋(BoW)模型将图像表示为向量形式,通过形成视觉词袋模型,计算每个标签对应图像集的TF-IDF向量的内聚距离、分离距离,通过比对标签间TF-IDF向量质心距离的大小,去除非视觉性语义标签。二、通过将标签表示为语义词向量来计算图像之间的语义相似关系,形成相似对和不相似对集合。三、根据语义相似关系训练卷积神经网络(CNN)。本文的CNN模型输出层为图像的哈希编码。训练目标为:让语义相似的图像对的汉明距离尽量接近,而语义不相似的则相互远离。通过动量梯度下降算法迭代更新目标函数。将图像映射为哈希码后,通过比对图像间的哈希码实现快速图像检索。本文使用MAP、Precision等度量方法在NUS-WIDE测试集上进行实验以验证提出的图像检索方法的性能。与BRE-CNN、LSH、ITQ、DSCH等先进算法做对比分析,结果表明,本文提出的基于弱监督哈希函数的卷积神经网络(Weakly-Supervised Hash CNN,WSH-CNN)方法在检索的精确度上优于上述几种方法。
其他文献
近期,24台崭新的三一SY215挖掘机运抵印尼苏拉威西岛,参建印尼青山工业园新一期工程。目前,在这个备受瞩目的项目上,有近600台三一挖掘机挥舞“臂膀”,全速推进项目进度。作
调味品是否变质,首先从气味判断林女士喜欢烹饪,但令她烦恼的是,各式烹饪需要用到不同的调配料,而这些配料每次只用少量,但买的时候必须整包、整瓶购买回家,目复一日,厨房里堆满了各
根据压实机械行走驱动的特性研究,重点以全驱型单钢轮压路机智能电子液压系统的直行模式及爬坡模式的系统设计分析,在建立电子液压驱动系统的设计原则情况下,进行不同工况驱
美国伊利诺伊大学生物实验室的鱼缸里,养着一群三刺鱼鱼苗,它们是一项特殊研究的观察对象。做实验时,研究人员将一只只三刺鱼逐个放入单独的小型鱼缸中,并用摄像机进行全程记录。