【摘 要】
:
随着网络信息化的发展,语音、图像、视频等多媒体信息高速增长,针对其中含有丰富视觉信息的海量图像,如何在大规模图像库中准确、快速地检索出用户需要的图像,成为多媒体信息
论文部分内容阅读
随着网络信息化的发展,语音、图像、视频等多媒体信息高速增长,针对其中含有丰富视觉信息的海量图像,如何在大规模图像库中准确、快速地检索出用户需要的图像,成为多媒体信息检索领域的研究热点。深度卷积神经网络具有很强的非线性表示能力,能够理解图像更深层次的语义信息,被广泛应用于图像识别、目标检测、物体分割等领域。本文针对图像检索问题,对当前国内外图像检索技术研究进展进行了总结,利用深度学习技术提取图像特征,并在现有基于内容的图像检索方法上进行了改进,本文的工作内容主要分为以下两个部分:(1)基于多层特征图融合的哈希图像检索方法在实际的大规模图像检索任务中,网络高层的特征损失了很多局部细节信息,导致检索结果不精准,针对这个问题,使用多层特征图融合的方法将网络中不同层的特征图谱进行融合,使得到的特征同时含有高层的抽象语义信息和低层的局部细节信息。同时,为了加快图像检索速度,使用了近似最近邻搜索策略,这是应用于大规模图像检索的一种高效的搜索策略。实验证明,相较于目前主流方法,这种基于深度学习与多层特征图融合的哈希图像检索方法具有精确度高、检索速度快等特点。(2)基于特征融合与显著性检测的图像检索方法在基于深度学习的图像检索中,提取的特征往往包含了复杂的背景噪声,导致图像检索的精确率并不高,如何提取图像的显著性特征逐渐成为研究的重点。针对该问题,提出一种特征融合与显著性检测的方法,该方法首先训练用于分类的深度卷积神经网络模型,并将图像卷积之后的特征图谱进行融合,得到图像的显著性区域,最后计算图像显著性特征的余弦距离来进行检索。实验结果证明,相比目前主流的方法,该方法能够有效提高检测精度,且鲁棒性较高。
其他文献
随着互联网和通信技术的发展,用户对于通信网络的要求越来越高,传统单一的无线网络技术已经不能支撑用户日益增长的需求。虽然不同无线网络的异构融合技术的出现在一定程度上
在现有的软件开发过程中,高层的设计概念和实现这些设计的程序设计语言成分之间常常缺乏直接的对应关系,导致很多设计概念湮没于琐碎的代码中。不能从代码中恢复出这些设计概念
语音识别技术经过50多年的发展,已经在社会生活中得到了广泛的应用。在语音识别技术的发展历程上形成了各种理论和方法,如矢量量化、隐马尔科夫模型、神经网络等,隐马尔科夫
TTCN-3是一种标准的测试描述语言,可用于多种通信端口上的各种响应系统的测试。TTCN-3已经被广泛地应用于协议测试。TTCN-3不仅可以用于功能测试,还可以用于其它类型测试,如
信息的传播与扩散在当今信息社会显得非常重要,而如何利用人与人之间的联系,使得信息迅速、广泛的传播成为社会网络研究的一个重点。Domingos和Richardson将此抽象为影响最大
文本聚类是数据挖掘和信息检索领域的一个重要研究方向。随着网络上堆积的数据日益庞大,且大部分数据以文本形式存储,人们对从大量文本中获取信息的需求越来越高。文本聚类方
由于Web服务的良好封装性、高度松耦合性和可集成性的优点,越来越多的企业开始采用面向服务SOA(Service Oriented Architecture)架构,借此来满足业务的需要。随着Web服务技术的
Web Service是使用Internet上统一、开放的标准,来实现原来各孤立的站点之间的信息相互通信、共享的一种接口。软件测试是软件开发中不可或缺的环节,是软件工程中的重要组成
计算机技术在审计领域的应用日趋广泛。审计工作的进行需要各被审对象提供数据,但是各被审对象提供的数据具有异构性。以某省联网审计系统为例,数据在进入数据中心之前需要进
H.264/AVC标准是由ISO/IEC的运动图像专家组(MPEG)和ITU的视频编码专家组(VCEG)组成的联合视频专家组共同制定的最新视频编码标准。H.264标准引入了许多先进的视频压缩编码技