面向图文检索的跨模态学习算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:hhejiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多媒体数据呈爆炸式增长且以不同形态呈现在互联网中,多媒体数据的关联分析和处理已成为重要研究课题。其中,跨模态检索技术更是受到工业界和学术界的广泛关注。与传统单模态信息检索技术不同,跨模态检索通常使用任意模态的查询数据检索来自其它模态语义相关的实例。然而,不同模态数据通常存在于不同的特征空间且底层特征和高层语义之间难以关联,这就导致了跨模态检索任务中的基本挑战:如何对齐底层“异构表征”及桥接高层“语义鸿沟”。除此之外,在实际应用中,多媒体数据往往呈现出多而杂的特性,这也衍生出一系列数据标注困难、数据缺失及检索效率低下等问题。因此本文在关注跨模态检索技术中基本问题的同时,还在数据自动标注、缺失数据补齐及检索效率提升等方面进行了相关研究。具体研究内容概括如下:1、针对跨模态检索中异构表征及语义鸿沟问题,本文提出了一种基于多类别联合子空间学习的跨模态检索算法。鉴于现有跨模态检索算法普遍忽略了不同类别的语义分布差异,本算法提出针对特定任务和特定类别学习特定的投影矩阵,并通过一种联合学习策略,尽可能区分语义分布差异的同时充分挖掘类间语义重叠信息。在检索阶段,结合具体样例通过一个预训练的线性分类器自适应地关联最优投影矩阵,从而将多模态数据映射到潜在语义子空间进行相似度测量并返回最终检索结果。2、针对数据缺失及数据标注问题,本文提出了一种基于虚拟数据生成的半监督跨模态检索算法。该算法提出了一种基于聚类中心的虚拟数据重构方法,可有效补齐缺失数据,从而构建完整的训练数据。此外,建立了聚类中心与未标记样本的关系映射表,作为标记预测的基本准则。最后,将语义关联分析、相关性分析及特征选择整合在一个联合的跨模态检索框架中进行子空间学习。3、为了进一步提升半监督算法的学习效率及准确性,本文还提出了一种自适应的半监督特征选择跨模态检索算法。由于传统半监督算法往往忽略标记预测与子空间学习之间的动态优化关系,大大降低了半监督检索算法在跨模态检索任务中的性能。因此,本算法提出为不同查询模态数据定义特定的语义关联的图正则化项,不仅将标记预测及子空间学习融合为一个统一的动态学习框架;还有效保持了数据原有语义和结构特性,进一步确保了特定任务上标记预测的准确性,从而大大提升了半监督跨模态检索算法的性能。4、为了解决大数据背景下检索速度和存储空间的问题,本文提出了一种基于继承映射的跨模态哈希检索算法。本算法首先以线性映射的方式进行异构信息嵌入,同时提出一种继承映射的概念保证异构关联信息从原始特征空间到哈希空间的继承。除此之外,本算法还引入仅具有线性复杂度的超图模型,进一步挖掘了数据在原始特征空间的结构关系,从而使得学到的统一哈希码具有更丰富的原始关联信息。
其他文献
2013年,我国部分地方政府开始将绩效管理的评价组织工作从纪委监察部门移交到编办部门。实际上,政府绩效管理组织主体变迁是政府绩效管理体制的变革,是政府绩效管理在顶层设
生物特征用于身份认证时在安全性、准确性和易用性上具有很大优势,这也是其逐渐替代传统身份识别方法的重要原因。目前身份认证系统大多数使用静态的生物特征,比如人脸图像、虹膜图像、眼周图像等。虽然使用静态生物特征的身份识别方法具有较高的准确率,但是随着信息技术的发展,静态生物特征模板容易被仿造,从而造成身份误认的现象。因此,需要进一步研究基于动态生物特征或者动静态生物特征融合的身份识别方法来避免伪造信息对
近些年来,微藻作为一种新型的能源物质备受关注,并且在环境治理、医疗保健等领域都有着广泛的应用,如何高效培养微藻也随之成为了当前一研究热点。优化反应器形式可以有效地
随着信息技术的飞速发展和网络新时代的来临,现代人的日常生活与网络息息相关,越来越多的人因为电子商务平台和社交网络平台而发生了改变,同时人们每日都会在网络上留下大量的评论,如何有效的分析出情感倾向具有非常重要的意义,情感分析应运而生。情感分析是在挖掘大量互联网文本的基础上对观点持有人的立场和情感进行分析。情感分析的工作主要集中在三个方面,文档级别情感分析、句子级别情感分析和方面级别情感分析。由于文档
动压马达是陀螺仪表中产生可靠转动惯量的核心部件,其性能直接影响陀螺仪表甚至飞行器的精度与可靠性。而作为动压马达中的核心元件,动压马达气浮轴承的转子和定子组件之间的
基于事后及时有效的补救行为而对犯罪予以定罪免刑或者不予追究刑事责任的处理,散见于非法吸收公众存款罪、信用卡诈骗罪、拒不支付劳动报酬罪等经济犯罪的立法或司法解释中。经济犯罪中的及时有效补救行为,不完全等同于传统理论中的事后“悔罪态度”,其恢复法益的彻底性又与违法阻却事由有所区别,“不予追究刑事责任”亦不同于“免予刑事处罚”。经济犯罪中的事后恢复行为,有其独立的理论研究价值,是以经济犯罪法益可恢复性为
天然气水合物是未来极具潜力的替代能源,常与沉积物伴生存在,沉积物的性质会直接影响水合物的成藏及开采方法的选择。其商业化开采的困难在于仍未明确水合物在沉积物中的生长
未成年人刑事案件分案审理是实现审判阶段对未成年被告人保护的重要程序之一。该程序通过将共同犯罪案件中的未成年被告人犯罪部分和成年被告人犯罪部分分开审理,以促使在案件审理的过程中能够更好地教育和挽救失足少年。当前,未成年人刑事案件分案审理已经成为理论界和实务界共同的默契,但是囿于我国刑事程序法律和相关司法解释规定的不明确,实践中出现诸多问题。未成年人与成年人共同犯罪案件何时分案审理,何时并案审理?分案
齿轮传动是应用极为广泛的一种机械传动方式。它具有大传递功率、高传递效率、定传动比等特点,在航空、舰船、机器人、医疗器械等多个领域都有着重要应用。目前,我国在齿轮加
在人工智能范围中,不确定性推理泛指除精确推理以外的其它各种推理问题。包括不完备、不精确知识的推理、模糊知识的推理、非单调性推理等。在众多不确定性推理方法中,贝叶斯网(Bayesian belief networks)是属于一种基于模型的内涵方法。简单来讲,它提供了特定领域知识的一种模型表示以及基于这种模型的若干种学习和推理机制,用于建立模型并回答与这些领域知识相关的问询,并在此基础上进行辅助预测、