用卷积神经网络的多标签图像检索方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lq306330997
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,关于图像检索的研究趋向于成熟,但是依然存在多个亟待解决的问题,如消除语义鸿沟,降低图像特征维度,提高图像检索速度等。最初研究学者们将哈希算法应用于图像检索中,有效地缓解了图像特征存储和计算的问题。但是又引出了哈希码与图像特征之间存在差异的问题。近些年,研究学者们将深度学习融入图像检索中,使得检索中能提取图像更深层次的特征。卷积神经网络与哈希算法结合形成图像检索模型是图像检索的发展趋势,但是这种模型并不成熟,而且卷积神经网络本身处于发展阶段,需要克服一些问题,如模型的构建,模型参数选择与优化,语义鸿沟等。本文则根据以上问题设计了合适的图像检索框架。论文主要工作如下:(1)学习并分析卷积神经网络工作原理和优化方法,同时研究了关于哈希函数的多种算法;(2)改进传统图像检索框架。本文利用任意两个图像的标签生成图像对标签作为预期值,并且将两个图像最终得到的特征值转换为这一对图像的实际值。网络的训练标准由利用单个图像的特征和标签改变为利用图像对的实际值和预期值;(3)本文改进了传统的用于特征提取的卷积神经网络模型VGG。在VGG模型基础上对网络架构进行了改进,用多层感知器和全局平均池化层替换了传统卷积层和全连接层,通过这个网络进行图像特征提取。改进后的卷积神经网络模型参数大量减少,简化了结构,提升了检索速度;(4)本文改进了网络学习算法,网络学习算法包含三个部分:哈希函数,损失函数和随机下降梯度算法。本文对学习算法中的损失函数进行了改进,本文的损失函数不仅包括目标值和实际值的损失项,还包括根据哈希码中比特之间的独立性和图像平稳性而得到的特征值与哈希码的差异以及实际图像哈希均值与哈希码均值0.5的差异。这个学习算法不仅减少了目标值与预期值的差异,还缓解了语义鸿沟,无论图像表示为哈希码还是特征值,都能够保证图像的平稳性。将上述的研究点整合为一个多标签图像检索框架。利用CIFAR-10,NUS-WIDE和Caltech101数据集对框架进行测试,与其他方法比较,本文框架检索的速度和准确率有所提升。
其他文献
介绍了作战节点的概念和分类,结合对美军C4ISR体系结构框架研究,对作战节点进行了定义。讲述了基于作战节点的作战任务的区分方法,并结合实例进行了说明。
随着电子商务的发展,网络购物需求日益增大,为我国快递业的发展提供了广阔的市场空间和发展机会,近年来快递业务量呈现爆发式增长。快递物流网络的合理布局,对于降低快递物流
目的研究糖皮质激素受体(GR)在豚鼠耳蜗的分布及声损伤对豚鼠耳蜗GR表达的影响。方法将豚鼠随机分为2组:实验组豚鼠在强度115dBSPL的白噪声中暴露3h。暴露结束后2h,断头取耳
随着经济水平的提高,艺术品也逐渐进入了我们的生活,与之相关并紧密相联系的就是艺术法。目前我国艺术法还不够完善,甚至没有一部专门相设的艺术法,越来越多的问题,我们必须
美拉德反应(Maillard reaction),又称羰氨反应,是广泛存在于食品工业中的一种非酶促褐变反应。在食品加工与贮藏过程中,美拉德反应是赋予食品色、香、味的主要途径。但是,美拉
<正>溃疡性结肠炎(UC)又称之为慢性非特异性溃疡性结肠炎,是一种主要累及结直肠黏膜的慢性非特异性炎症,以腹痛、腹泻、黏液血便、里急后重等为主要症状。本病至今没有特异性
本文以汉语中的“绿”和英语中的“green”这两个对应词为例,探讨汉英民族颜色词的国俗语义异同现象.以期对跨文化交际有所裨益。
产业融合是特色小镇促进乡村振兴的关键路径,特色小镇是实施乡村振兴战略的重要平台,特色小镇建设能够带动乡村产业融合发展。在分析特色小镇建设的产业功能基础上,探讨河北
做为一名当代文学评论家,季红真并非注重在文学批评中建构自己的文学观念。她的评论通常是与具体的作家作品紧密结合,发掘每一位作家独特的创作个性,并从宏观的角度将作家及
人工湿地在净化水质的同时,逐步成为城市一种重要的生态景观类型。该研究探讨了生态理念下人工湿地的特点及设计关键,并以湖北钟祥镜月湖为例,在场地分析的基础上,以水环境治