基于显著性检测的图像检索方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xxxxx20090818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索技术旨在根据用户提供的输入图像,寻找在图像库中相同或相似的图像作为输出。此技术如今被用在了诸多领域,在网络购物方面,用户可以利用此技术快速寻找自己想要的商品。在医疗方面,可以用此技术进行病症搜索,寻找身体中可能出现疾病的部位,防范于未然。虽然当今图像检索技术已有长足发展,但现有方法的检索效果仍然有进步的空间。当前大多数方法使用了基于深度学习的技术,能够在原图中提取出许多表征能力强的高维特征,但其对主体信息的提取与表达依然不够理想,从而会对检索结果产生不利影响。本文针对上述问题,提出了基于显著性检测的两段式图像检索模型。在模型的第一阶段,本文会对图像中的主体目标进行处理与抽取,第二阶段则利用抽出的图像主体进行特征提取。针对现有方法对图像中主体信息提取得不够好、对图像中上下文信息的融合做得还不够到位的问题,本文提出了基于多注意力的显著性目标检测方法,即本文的第一阶段。此方法在注意力提取方面,通过上下左右四个方向的扫描以充分获得全局上下文信息,同时利用全卷积结构对图像的局部上下文信息进行抽取。在上下文信息的聚合方面,利用残差结构结合编码解码网络,提出了先捕获全局信息,在此基础上再进行局部信息抽取的方法。最后通过对比实验,验证本方法的有效性,表明通过此方法能够获得信息更加全面的特征,从而进行更好的显著性预测。在获得图像主体目标后,需要对该主体的特征进行进一步抽象与精简,即本文的第二阶段。而当前特征提取方法在图像检索任务中对图像特征的信息重组与拼接方面还不够理想,针对此问题,本文使用了可训练的池化方法,此方法可以随着训练过程的推进,获得更适合本任务的参数值,从而通过该池化方法能得到表征能力更强的图像表示。通过实验,可以得知通过此方式得到的图像表示在检索任务上能获得不错的结果,验证了该方法在检索任务中的有效性。
其他文献
在视频监控系统中,识别人们玩手机、摔倒或打架的动作是必要的。动作识别是人的三维运动信息,在真实的监控视频中快速准确的识别人的动作仍存在很多问题。为了解决这一问题,
心血管疾病是目前最主要的公共卫生问题,医学图像在心血管疾病的医学临床辅助诊断中有着不可或缺的重要作用。白细胞分类计数作为心血管疾病初步诊查项目中一项意义重大的技
近年来随着深度学习的快速发展,视觉问题生成(VQG)逐渐开始成为一项重要的研究内容,它的任务形式是对于输入的图像给出关于图像内容的一些问题,VQG在多模态对话、幼儿教育以
随着新一代数字货币——比特币的兴起,其底层支撑技术区块链也受到社会的关注,并被认为是信息互联网向价值互联网转换的基石。但是区块链技术体系依赖于全局账本的公开透明化
目前,我们正经历着从信息时代到数据时代的变迁,运用数据时代大量的信息,可以为我们生活带来许多便利,然而如何去使用这些信息却成了一大难题。而推荐系统则可通过技术手段,
Long(1988,1991)将“形式聚焦教学”(Form-focused Instruction)分为了“重形式教学”(Focus on Form)和“全形式教学”(Focus on Forms)两种教学方式。他认为在以意义为中心
重症监护室(ICU)主要收治生命危急但有可能挽救的危重病人,集中了医院中最先进的设备和优秀的医护人员,是医院的重要组成部分。病人进入ICU后会进行死亡率预测和健康状态的实
在区块链技术发展这十年间,区块链已经作为一种核心技术广泛试用于金融、物联网、物流、医疗和保险等多个领域,尤其是在以比特币为代表的数字货币领域,已经获得了很广泛的认
车辆轨迹数据中包含丰富的交通运行和车辆行驶特性,对于交通流理论分析和建模起到了关键支撑。近年来,无人机航拍成为一种高效、便捷、经济的交通视频采集手段。本研究旨在构
将机器视觉技术应用于果实产量估计以及果蔬采摘机器人的对象识别,能大幅减少种植管理过程中的人工操作,降低劳动强度,节约用工成本,有助于实现果园管理的自动化、智能化。早