融合文本特征的图像检索语义增强方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户：blueteen

【摘要】

：

【作者】

：

王振鹏

【机构】

：

南京理工大学

【出处】

：

南京理工大学

【发表日期】

：

2020年01期

【关键词】

：

图像检索注意力机制 Faster-RCNN 卷积神经网络颜色特征空间关系特征循环神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数字化等信息技术的不断发展,数字图像信息不管是从数量上还是规模上都在飞速增长,如何管理和应用这些海量图像资源成为当前重点研究问题之一。就图像检索技术而言,传统利用人工标注关键字进行图像检索的技术已满足不了人们的实际需要,最近几年,基于内容的图像检索技术逐渐成为了新的研究热点。通常人们判别两张图像的相似程度并非根据图像的底层特征,而是根据图像描述的内容。而计算机对图像底层特征的理解较为容易,对获取图像高层语义内容描述较难,这即为基于内容的图像检索研究的主要难点。本文以提高图像检索性能为目标,就图像文本特征的提取,图像语义理解等问题进行了相关研究。主要研究工作如下:1、给出了一种注意力增强的图像文本信息获取方法。为了获取图像中含有的文本内容,利用Faster-RCNN网络对文本区域进行检测,同时,在网络模型上添加了注意力机制,通过注意力区域的获得,减少候选框的数量,由此在保证检测准确度的基础上,缩短了图像文本区域的检测时间。接着对检测到的文本区域进行处理,通过连通域检测、字符分割等操作获得单个文本字符图片,然后利用卷积神经网络对字符图像进行识别,最终获得图像文本内容。2、提出了一种融合文本特征的图像语义增强算法。同样利用Faster-RCNN网络对图像的目标进行检测,并提取图像的颜色特征,同时根据各个目标区域之间的相对位置获取空间关系特征,结合研究内容1中获得的文本特征,利用循环神经网络生成图像语义描述。3、给出一种融合文本特征的图像检索语义增强方法。将研究内容2生成的图像语义描述通过特征提取转换为图像语义特征向量,根据该方式将图像数据库提取特征获得图像特征库,在查询图像时,通过将其提取语义特征,并在特征库中进行相似性度量,最终实现图像检索的目的。对于本文提出的每一个算法,在对应的章节中,均通过实验进行了验证。实验结果表明给出的模型与算法都是切实有效的,与现有方法相比,本文的方法可以获得更准确的语义描述,并更加精确的完成融合文本特征的图像检索工作,使得人们能够更好的管理和应用海量图像数据。

其他文献

基于偏振差分成像的浑浊介质中目标检测方法研究

雾霾中的目标识别、海底探测、水下成像、生物医学诊断以及酒水生产中的异物检测等实际应用场景中,均涉及浑浊介质中的目标检测问题。浑浊介质中散射粒子的后向散射导致目标信息被掩盖,目标检测、目标识别等工作的开展较为困难。本文将图像处理与偏振成像技术相结合,提出了基于偏振差分成像的浑浊介质中目标检测方法。首先,本文对基于偏振差分成像的浑浊介质中目标检测的研究背景及意义,以及国内外研究现状进行了分析。其次,阐

学位

浑浊介质偏振差分成像目标检测图像融合导向滤波

人脸肤质检测与评价系统的研究

人脸肤质作为个人形象气质的重要表征,伴随着美容护肤意识逐渐深入人心,各种关于人脸肤质检测的产品也开始被市场接受。针对市场上主流的基于单一传感器的肤质检测仪功能较少的问题,以及功能完备的大型肤质检测设备成本高、体积大的问题,本文基于“硬件+软件”的思路设计了面向个人日常美容检测的肤质检测与评价系统,实现了对面部常见的肤色、油份、水份、纹理、毛孔、色素沉淀以及皮肤炎症7项肤质指标的准确检测与评价。首先

学位

皮肤肤质特征肤质评价残差网络图像分类

衍射光谱计算成像重构技术研究

衍射光谱计算成像技术是计算光学成像的重要组成部分,在光学遥感领域具有重要的应用价值。不同于传统的成像光谱仪,衍射透镜成像光谱仪利用衍射光学元件同时实现色散和成像功能,具有光通量大、结构紧凑、性价比高、可凝视成像、易小型化、稳定性高等特点,发展前景广阔。但是在数据采集的过程中,准焦波段图像会受到其他离焦谱段图像的干扰使其变得模糊,如何从污染严重的光谱图像中恢复出清晰图像成了限制衍射光谱计算成像技术发

学位

衍射光谱成像图像重构空谱全变差低秩约束交替方向乘子法

基于联合网络的驾驶员3D姿态估计

驾驶员姿态估计是人体姿态估计中的一个重要应用场景,在高级辅助驾驶系统中起着关键作用。作为一个中间层信息,驾驶员姿态估计可以帮助驾驶员状态检测系统识别驾驶员状态,判断驾驶员行为是否恰当且安全。一般来说,驾驶员3D姿态估计能够比2D姿态估计提供更多的信息。因此,驾驶员3D姿态估计成为了我们的研究方向。传统的人体姿态估计是基于可见光图像或深度图像,对于驾驶员姿态估计来说,可见光图像容易受到昼夜变化和环境

学位

驾驶人3D姿态估计深度学习点云联合2D-3D网络循环神经网络

基于情感分析的敏感信息识别方法研究

自进入信息时代以来,各种良莠不齐的信息充斥着人们的生活,不少境外势力和不法分子通过互联网散布和传播一些敏感信息,以煽动并引导网络舆情。以微博为代表的各种网络媒体包含了大量关于暴力事件、恐怖袭击事件、政治时事等话题的文本,这些文本反映了用户对事件的态度,观点和倾向。敏感信息识别作为避免网络舆论被恶意引导的重要手段,近几年成为了一个重要研究问题。本文针对网络文本中的暴恐敏感信息识别任务中的情感分析和敏

学位

敏感信息识别情感分析特征构建自注意力机制敏感触发事件

物联网中嵌入式设备的远程证明协议研究

近年来,物联网发展迅猛,物联网设备已经走入千家万户,其数量规模呈爆发式增长。然而,物联网设备的普及在带来便利的同时也带来了安全隐患。物联网嵌入式设备大多在计算能力、存储能力等方面受限,这使得他们往往缺乏自我保护的能力。大量的物联网设备直接暴露在攻击者的视线内,导致物联网安全事件频发,物联网设备安全受到了广泛关注,保护物联网设备的安全成为物联网安全研究中的重点。远程证明允许一个可信实体验证远距离的、

学位

物联网物联网安全远程证明物理攻击设备异构性

Android应用网络相关行为测试

对于大多数Android应用程序而言,网络在提供应用程序功能方面起着至关重要的作用,同时网络使用导致的错误占了应用程序崩溃的很大比例。由于许多与网络相关的错误只能在特定条件下触发（例如,当网络速度较慢时,网络响应需要较长的等待时间）,因此现有的常规或GUI测试方法很难将其检测出来。据统计,较少有测试应用程序中网络使用情况的工作。为解决上述问题,本文从移动应用网络相关的错误展开研究,借助软件定义的思

学位

Android应用网络相关行为模糊测试网络活动自动化策略

基于图正则化的子空间聚类算法研究

子空间聚类是传统聚类问题的拓展,目的是将位于多个子空间的并集上的数据点分割到其相应的子空间中。稀疏子空间聚类（SSC）和基于低秩表示（LRR）的算法是最有代表性的两种子空间聚类算法。为了获取结构更加理想的系数矩阵,本文提出了基于图正则化的子空间聚类算法。子空间聚类算法的基本方法是,建立模型寻求数据理想的表示系数矩阵,然后通过增广拉格朗日乘子法求解模型,并根据系数矩阵构建相似度矩阵,最后用谱聚类的方

学位

子空间聚类稀疏低秩图正则项拉普拉斯矩阵增广拉格拉日乘子法谱聚类

基于元学习的视频目标分割方法研究

视频目标分割任务是计算机视觉领域中一个非常基础但又充满挑战性的问题。这个问题可以描述为:已知视频中目标在第一帧的分割掩膜,求解后续每一帧内对应目标分割的结果。视频分割技术作为大数据处理应用中的重要一环,在当代生活中发挥着越来越不可替代的作用。与此同时,视频目标分割技术已经在视频监控、虚拟现实、异常检测和自动驾驶等领域获得了广泛的应用。现存的方法主要有两个问题需要面对:第一点是在遮挡、外观变化大、背

学位

元学习视频目标分割在线自适应网络架构搜索

基于时空特征学习与傅立叶聚合的视频去模糊方法

视频拍摄中,图像采集环境差、成像系统退化和目标物体运动等容易导致采样视频存在不必要的模糊。研究者们提出了许多优秀的视频去模糊方法。但由于视频图像特有的时空相关性,如何综合利用时空信息依然有很大的改进空间。本文首先综合回顾了国内外研究现状,分析并实现了三种经典的视频去模糊算法:加权傅立叶聚合视频去模糊算法（Weighted Fourier Accumulation Algorithm,WFA）,基于

学位

傅立叶聚合深度学习编码-解码器网络视频去模糊

融合文本特征的图像检索语义增强方法研究

其他学术论文