基于深度卷积神经网络的语义图像检索研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:weiwen2100000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索问题作为计算机视觉的一个基本问题,已经有很多学者对它进行过分析和研究。本世纪初,人们逐渐认识到低级特征和高级语义特征之间固有的“语义鸿沟”,开始涉及基于语义的图像检索,但收效甚微。近年来,深度学习技术为饱受到传统人工特征困扰的基于语义的图像检索问题打开了新的大门。相比较传统方法,深度学习模型在挖掘深层次特征上有惊人的能力,更可能满足图像语义特征学习。但是,深度学习本身也处在一个快速发展的阶段,并不是完全成熟的工具,在使用过程中需要克服一些深度学习本身带来的问题。例如,深度模型在实际训练中的参数优化问题。同时我们该选择什么样的深度模型来应对基于语义的图像检索问题,是我们首先需要考虑的。本文梳理了图像检索技术和深度学习技术的发展历程。在此基础上,提出了一种基于语义的图像检索框架。该框架中主要包含三部分:(1)特征提取网络,在本文中称为多层级的图像语义特征提取网络,框架通过该网络提取语义特征;(2)特征存储结构,它将提取出来的特征降维并转化成图像语义距离度量公式可以计算的格式;(3)图像语义距离度量公式,框架最终通过它实现图像语义距离的计算。多层级的图像语义特征提取网络是该框架的核心,它的性能直接影响着整个框架的最终精度,该网络能通过其层级结构分次对图像中的语义特征进行提取,独特的结构设计使得它可以挖掘图像中更深层的语义。特征存储结构将提取出来的图像语义特征转化成一种更低维更易计算的融合特征表,而图像语义距离度量公式则将通过融合特征表计算图像之间的语义距离,从而生成检索结果序列。在基于语义的图像检索框架中,多层级的图像语义特征提取网络可以被替换成其他分类网络,以灵活地应对不同的待检索图像。在多个数据集上的测试结果表明,与现有方法相比,本文框架能够更加准确地完成基于语义的图像检索工作。
其他文献
7号信令是由ITU-T制定的全球电信业的标准。这个标准指定了在通信中各个网络点通过数字信令网交换信息的过程及协议。在以电路交换为基础的GSM网络中,信令流程是一切通信过程
文化与经济发展关系的研究基本上可分为五种论点 ,既有古典经济理论的探索 ,也有经济发展理论、管理理论与其他社会科学的贡献 ,而最近的研究成果则集中体现在新制度经济学上
校企合办的产业学院可以置于新制度经济学分析框架。运用威廉姆森的交易成本理论,梳理了产业学院运行的事前成本和事后成本,指出有限理性、机会主义、不确定性、资产专用性、
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
高速电梯在水平和垂直方向的振动是影响舒适感的主要因素。为了提高舒适型并缓解振动和冲击对电梯内部仪器的影响,对电梯振动的动力学参数进行了优化。通过虚拟样机技术(virtu
提供给儿童阅读的图画书中隐含着成人的童年假设与教育观念。图画书中儿童因违规受罚的根本原因在于"不听话"而非"无知",儿童规训的实质亦在于此。故事中的惩罚从严厉到温情,
<正> 从国外中医学的研究动向来看,和国内正在热烈展开讨论的关于中医现代化和三种力量并存的问题一样,也存在着意见分歧和争论,见仁见智,各说不一。为了有助于当前的讨论,现