跨模态离散哈希学习的标签增强方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:my_zq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在海量且多样化的数据充斥人们生活、工作、学习等方方面面的今天,如何在繁杂庞大的数据中高效、有效的检索到目标数据成为了检索研究方向一个亟待解决的重要问题。哈希检索因其检索上准确、快速的优点引起了大量关注。研究证明,在实际检索应用中有监督哈希方法要比无监督哈希方法的效果更好。时至今日,尽管有监督跨模态哈希技术已经有了不小的进展,但是仍然存在着一些问题需要解决。例如,大部分有监督哈希方法为了获取模态相似性使用了成对相似性矩阵,但会使得计算复杂度增加,存储成本消耗巨大;有一些哈希方法,为了学习不同模态之间的相似性,强制将模态信息映射到同一潜在语义空间内,而疏忽了模态原本所带有的信息,造成了语义信息的缺失,从而存在检索成本高、准确度不高的问题。针对这些问题我们开展了一些研究:本文的主要研究内容如下:(1)使用两步哈希方法分步骤学习哈希码和哈希函数,使得整个哈希学习过程更加灵活。为了能够学习到更丰富的公共潜在子空间,并降低检索速度,我们利用距离-距离差异最小化问题将包含了原始模态信息和标签信息之间的丰富语义特征嵌入子空间中。通过避免使用较大规模的成对相似性矩阵,减少时间和计算复杂性,在提升准确度的同时也能提升检索速度。(2)能在对哈希码放松约束的情况下仍然生成有效哈希码。由于生成哈希码是离散的,对其施加一些条件约束后变得难以求解,我们通过对潜在子空间施加约束,使其逼近于哈希码。(3)使用多个子空间学习不同模态的相似性和模态的特有信息,为保证不同模态数据之间的相似性,同时保持不同模态的特有信息,我们利用多个子空间去学习不同模态的信息,使得所学的多个子空间保持了原有模态的结构特征。经过实验对比进一步验证了方法的有效性和准确度。本文提出的两种方法与目前跨模态哈希检索方面的流行基准方法进行对比,实验结果证明本文提出的方法性能优于目前的基准方法。
其他文献
从视频中提取的有效信息是人类做出决策的重要依据,如何使用工具自动提取视频有效信息一直人类所追求的。目标追踪技术一直都是机器视觉研究领域的重要研究方向之一,在自动驾驶、飞行控制、视频监控以及无人机侦察等多个现实场景中都有着大量的应用。视频目标跟踪的主要任务是在给定视频序列的第一帧中手动标记待跟踪的目标,然后在未知后续帧中目标位置的情况下准确快速地估计目标的位置。然而,在实际应用场景中,存在着很多干扰
目标检测是人工智能领域热门研究课题之一,在各个行业领域内应用广泛。在传统中学生物理教学电路系统实验过程中,需要对学生所连接的电路系统进行评测打分。在教学过程中,师资力量是有限的,由于学生众多,不可能及时对每个学生的实验结果进行实时打分,如果依次打分会造成极大的时间浪费。所以,为了使得对学生实验结果进行实时打分,减少教学时长与提高教学效率,开发一个实时在线学生物理实验打分平台非常有必要。在嵌入式平台
皮肤病是人类日常生活中最常见的疾病之一,对生活质量有重大不利影响。早期的计算机辅助诊断系统大多以皮肤镜作为拍摄设备。由皮肤镜拍摄的图像虽然有一系列优点,如清晰,光照一致,没有嘈杂的背景,但也具有价格昂贵,需要拍摄技术等缺点。而开发诊断系统,自动识别由智能手机拍摄的临床皮肤病图像,将有利于大多数人使用该系统和人们做一个初步的自我诊断。自动分类智能手机拍摄的临床皮肤病图像是一项具有挑战性的任务。智能手
如今,每个人的生活都离不开手机,随着移动互联网5G技术的发展,视频逐渐成为大家记录生活和社交交流的主要方式。但是,由于Android系统的开源特性以及网络传输开放和共享的特性,使得Android手机上视频存储和传输的安全性问题被广泛关注。视频图像与简单的文本消息不同,其具有数据量大、相邻像素间相关性强、时间和空间上冗余度高等特点。因此主流的一些文本加密标准如数据加密标准(DES)、高级加密标准(A
得益于现代计算机计算力的不断提升,与数据相关的计算机应用技术获得了飞跃发展,在大数据时代中数据库中存储了海量的数据,人们的关注焦点从获取并存储大量数据转移到了如何对数据进行挖掘技术以获取其中有用的信息。科学实验数据、医疗数据、人口统计数据、金融数据等领域产生了不少与数据挖掘相关的应用技术,如今发展数据挖掘相关的算法成为了学术界与工业界的重点研究对象。数据挖掘的各类算法可以根据不同的目的分为多种类型
随着5G的逐渐普及,互联网加速发展,网络信息呈指数性爆炸增长。面对海量的数据,用户如何从中找寻到自己所需要的信息,以及信息提供商如何让自己提供的信息被目标用户关注并收取都成为迫切需要解决的问题。为有效应对该问题,人们发明了推荐系统并取得了良好的效果。推荐系统的核心部分是推荐算法,本文通过查阅大量资料文献对推荐算法进行研究与分析,针对算法中存在的用户兴趣迁移、数据稀疏等问题,提出了一种新的基于时间遗
信息物理融合系统是一个将计算资源、物理环境和网络控制集成在一起的多层次的,高度复杂的、集成式的综合性系统。它通过网络通信,计算和控制等技术之间互相密切的结合,为各种工程系统提供信息网络服务和实时监控。CPS系统作为一个实时系统,具有高度的安全性、可靠高效等特点。信息物理融合系统必须通过传感器感知对物理环境的变化进行不间断的实时的感知,然后通过网络把这些感知的信息传递出去。CPS具有广泛的的应用前景
随着信息技术的不断发展,网络渐渐成为人们倾诉情感的重要场所,针对情感倾向的研究被人们广泛关注。在过去的情感分析研究中,较为传统的机器学习方法有KNN、朴素贝叶斯及SVM等算法,虽然这些传统算法的性能优良,但往往需要借助人力进行大量的特征标注,并且不具备较好的拓展性。而深度学习在最近几年被广泛地应用在各种自然语言处理的任务里。如CNN利用不同的卷积核提取局部特征进行情感分析,LSTM以及它的众多变体
随着互联网技术的飞速发展,线上的数据量正呈指数式增长,用户越来越难以从海量数据中找到精准的内容,推荐系统的出现正是为解决这一矛盾提供了思路。推荐系统通过利用用户对信息的交互行为将用户与其感兴趣的信息联系起来,从而帮助用户从海量信息中发现自己的潜在兴趣。如何利用用户的历史行为数据去预测用户偏好、发现用户潜在需求,并进而向用户推荐个性化内容成为推荐系统持续关注的热点问题。现有推荐方法在用户成分简单、个
随着近些年自动驾驶技术、激光扫描技术和机器人技术等的蓬勃发展,我们需要更多的信息来获得更好的环境感觉,而不仅仅是依靠图像、视频,这时三维数据就是一个很好的补充。三维点云因为其表达形式比较简单并且可以从激光雷达设备直接获得等优势而广泛应用在计算机视觉的三维数据表示。伴随着深度学习在三维视觉中的发展,生成或重建高分辨率、高保真的点云的能力变得至关重要。尽管深度学习模型最近在点云分类、点云目标检测和点云