面向多媒体数据检索的语义引导哈希算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:sueprding
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展促使多媒体数据(Multimedia Data)成为“最大的数据”之一,因具有数量多、复杂性高、多样性、高维且多模态等特点,对实现高效检索提出了更高的要求。哈希(Hashing)技术将数据编码为一组二进制哈希码,紧凑的二进制表示可在汉明空间进行高效成对比较,在大规模数据的高效相似性检索中具有极大优势。多媒体大数据时代,利用哈希技术学习多媒体数据更加有效的语义特征表示并实现高效检索成为迫切需要解决的问题。此外,研究发现语义信息能够在哈希算法中发挥至关重要的作用,因此哈希学习中利用语义信息的有监督哈希算法比仅使用未标记数据的无监督哈希算法具有更好的准确性。本文开展多媒体数据检索任务的语义引导哈希算法研究工作,探索标签语义、成对相似度语义和拓扑语义,逐步提升哈希检索性能,主要研究内容和贡献如下:1)提出了融合标签语义的多媒体数据哈希检索算法。训练数据扩展语义标签可有效弥补多媒体数据的异构模态语义鸿沟。现有面向多媒体数据的哈希检索方法存在两个问题,一是“松弛+舍入”哈希优化策略会导致显著的量化误差,二是预先构造图结构以表征多媒体数据样本间关系会增加计算压力。基于上述考虑,提出了一种面向跨模态哈希检索任务(Cross-modal Hashing Retrieval)的离散潜层语义跨模态哈希(Discrete Latent Semantic Cross-modal Hashing,DLSCMH)算法。该算法在统一的哈希学习框架中同时发现异构多模态数据的潜在共享空间,通过显式的语义标签增强哈希码的语义表达能力。为求解哈希码,提出了一种迭代离散哈希优化策略,通过直接学习二进制哈希码降低量化损失。另外,为提高多模态哈希检索(Multi-modal Hashing Retrieval)性能,提出了一种有监督离散多模态哈希(Supervised Discrete Multi-modal Hashing,SDMH)算法。该算法利用多模态特征和有监督类别标签进行判别哈希码学习,支持非常高效的离散哈希优化。2)提出了嵌入成对相似度语义的多模态哈希算法。利用成对相似度语义建模多媒体数据样本间的语义相关性,提升哈希算法的检索性能。首先,提出了一种基于动态查询自适应的在线多模态哈希(Online Multi-modal Hashing with Dynamic Query-adaption,OMH-DQ)算法。该算法设计了一种自加权融合策略,将互补的多模态特征信息自适应地保存到哈希码中。在成对相似度语义的监督下学习哈希码,增强其语义表达能力,避免对称相似矩阵分解导致的计算和存储压力。离散哈希优化策略既提高了运算效率又避免了量化误差。无参数的在线哈希模块可根据动态查询内容自适应地学习查询哈希码。其次,提出了一种自适应在线多模态哈希(Flexible Online Multi-modal Hashing,FOMH)算法,为流式多媒体数据学习判别哈希码。该算法通过自适应多模态二值投影自动学习模态权重,及时捕获流式样本的变化。通过非对称在线监督哈希策略,增强哈希码的语义表达能力。通过离散在线优化策略直接更新哈希码,避免在线学习过程中传播二进制量化误差。3)提出了基于拓扑语义的多模态哈希算法。独立映射数据样本与其语义标签会忽略语义间复杂的拓扑结构。因此,有效捕获并建模语义标签间的相关性可提高哈希检索性能。提出了一种自适应图卷积多模态哈希(Flexible Graph Convolutional Multi-modal Hashing,FGCMH)算法,可在完整和不完整的数据集上实现多模态哈希检索。采用图卷积网络保存模态内结构信息、融合结构信息并消除异构模态鸿沟,在高层标签空间中建模语义标签间的相互依赖关系并指导判别哈希学习。结合自适应多模态融合损失、分类损失、量化损失和判别哈希学习损失四种损失,学习多模态融合描述符的紧凑哈希码。
其他文献
随着国内高品质常规油气资源储量的不断减少,我国油气勘探与开发正逐步向超深、深水以及页岩油、页岩气、煤层气、天然气水合物等非常规油气资源领域发展。采用长水平段的水平井进行油气资源的开采,可提高油气藏的开发效果,在页岩油和页岩气等油气资源的勘探与开发中得到越来越广泛的应用。然而,在大位移井及水平井钻井过程中,岩屑容易在环空的低边沉积,形成岩屑床,从而造成井眼清洁问题。因此,开展岩屑运移相关理论研究,可
医德医风智慧考评体系的构建与运用,有效实现了公立医院社会与经济效益的有机统一,为医务人员行为导向提供正向激励,充分促进了"健康中国"最终目标的达成。本文应用SWOT矩阵模型,对医院医德医风智慧考评体系的构建与运用进行了深入的现状分析、战略选择探讨以及对策思考。
未来规模化电动汽车的发展趋势适应当前国家“新基建”的号召,且为缓解化石能源危机以及环境问题提供了新的契机。然而,大量电动汽车充电具有随机性及不确定性等特点,是保证电网安全稳定运行所面临的巨大挑战。其中家庭用户的充电无序性更强,因此,对家庭充电负荷进行实时监测与提取,制定相应的需求响应策略或能效管理模式对其充电行为加以引导具有重要意义。为此,本文提出了一种利用电动汽车充电负荷低频特性的非侵入式充电负
学位
随着“十四五”新能源布局向中东部倾斜,中东部的新能源发展速度高于西部、北部地区,对受端电网新能源承载能力的研究变得越来越迫切。文中针对华东受端电网,提出了一种评估新能源承载规模上限的方法。该方法依托中国电科院研发的生产模拟软件,统筹直流规模、弃电率、交流断面限制、储能应用等因素,在满足电力电量平衡、调峰平衡等约束前提,优化求解各类电源开发规模,求得受调峰约束的新能源发展上限;依托综合仿真试验研究系
随着光伏风电等新能源的电源接入电网、充电桩等用电设备不断丰富,未来电网的来源将更加复杂。电网作为连接发电端和用电端的中端,在实现"碳达峰、碳中和"的目标中扮演着重要角色。在此背景下,整体电网发展的重点将聚焦智能化、信息化和互联化的方向以及电网构架安全性、稳定性的提升。当前由于新能源弃风、弃光量的不断增加,新能源消纳问题将深度影响我国能源转型与电力行业的可持续发展,也迫使我国的电网企业逐渐重视这个问
一、引言随着世界经济的快速增长和人口迅速膨胀,人类对能源的需求越来越大。现有的能源结构中,煤炭、石油等化石能源占有很大比重,但化石能源作为不可再生能源其储量有限,而且其燃烧和利用过程还会污染环境并排放温室气体。能源危机和环境污染是全人类面临的共同问题。在有限的资源利用和严格的环境保护的双重制约下实现人类的可持续发展,立足于科技进步,
会议
学位
学位
学位