【摘 要】
:
随着人机交互的发展,信息往往同时存在于语言,声音,图像等多个模态当中,如何有效地利用计算机对跨模态信息进行管理和理解已经成为人工智能领域一个热门的研究课题。本文专注于视觉和语言两个模态信息的匹配,即给定文本描述,挖掘与其匹配的图像区域或图像。我们首先按照开闭词集将论文划分为两大模块:第三,四章为闭词集任务;第五章为开词集任务。在现有工作的基础上,第三章提出了层次化奖励函数来处理相关数据集中的标注不
论文部分内容阅读
随着人机交互的发展,信息往往同时存在于语言,声音,图像等多个模态当中,如何有效地利用计算机对跨模态信息进行管理和理解已经成为人工智能领域一个热门的研究课题。本文专注于视觉和语言两个模态信息的匹配,即给定文本描述,挖掘与其匹配的图像区域或图像。我们首先按照开闭词集将论文划分为两大模块:第三,四章为闭词集任务;第五章为开词集任务。在现有工作的基础上,第三章提出了层次化奖励函数来处理相关数据集中的标注不完整,样本不均衡等问题;针对第三章随机采样和预训练模型的不足,第四章进一步提出了针对本任务的难负样本挖掘策略,并首次在监督学习的该任务中引进了知识库模块。在基于层次化奖励函数的方法中,我们首先分析了交叉熵损失被直接应用到视觉-语言匹配任务中时会产生的问题;为缓解这些问题,我们提出了一个层次化奖励函数,它动态地为目标,上下文和背景物体生成不同的学习率。为了尽可能的使训练与推理目标一致,我们利用层次化奖励函数来近似地最大化R@K指标作为目标函数,并使用策略梯度来求解该不可导函数。此外,我们改进了三元组损失来进一步提升性能,并利用混淆矩阵实现了由简到难的学习过程。在困难上下文物体挖掘的计算方法中,我们通过经典的视觉-语言匹配网络为每个图像区域评分,并将得分较高的负样本作为难负样本,与正样本一起送入第三阶段网络训练。该网络与评分网络结构相同,但输入为困难视觉样本与包括上下文短语在内的所有短语。此外,为了使得模型先验知识包含的物体类别不再局限于视觉特征提取模块的预训练模型中的类别,我们首次在监督学习的视觉-语言匹配任务中引入了知识库模块,并以文本相似度为桥梁,为每一个图像区域加权来过滤掉不类别匹配模块。在基于互联网的弱监督的开词集(可以在输入的文字中使用任意单词)计算方法中,为了将模型未学习过的单词转化为可计算的向量,我们利用互联网来挖掘这些单词的视觉特征表达,并利用挖掘高质量图像区域来提高框架性能。我们在针对句子-图像的视觉-语言匹配任务中验证了本文算法的有效性。为了进一步证明本文算法的实用价值,我们收集网络中真实的游记数据并提出了数据集TVN25,并在该数据集上进行了“游记配图”任务。本章算法无需人工标注(弱监督),具有高拓展性,有利于视觉-语言匹配任务的大规模商业化应用。
其他文献
在城市现代化公路桥梁的建设项目中,常常会看到叠合梁斜拉桥的身影,例如重庆城区目前在建桥梁中就有两座是叠合梁斜拉桥,一座是南纪门长江大桥,一座是水土嘉陵江大桥。不论是叠合梁斜拉桥的设计还是修建,都离不开桥梁的计算分析,又因叠合梁斜拉桥主梁由两种材料组成,在主梁模拟方式上和一种材料的差异明显,因此选择合理的主梁模拟方式是进行叠合梁斜拉桥计算分析的关键。本文以涪江大桥为依托工程,采用Midas/Civi
三轴平台式航空重力仪测量重力数据是以飞机为载体的一种新型测量方式,测量速度更迅速及测量区域更广泛。随着重力仪的快速发展,地球重力场数据分析与处理的工作对资源探测、地球科学、军事和导航等方面研究具有重大意义。本文对三轴平台航空重力仪的测量数据开展了深入地研究工作,主要研究内容有:设计了三轴平台航空测量数据处理的总体方案,分为三轴稳定平台倾斜改正、重力异常解算和航空测量数据处理的软件设计这三个模块。平
由于采用传统方法设计的无功补偿装置存在着不足,经常出现烧毁电容器或电抗器的事故,为了克服这些不足,提出了一种基于系统设计的方法进行无功补偿的设计.通过详细的理论推导
为确保上海虹桥综合交通枢纽交通中心工程西交通广场南北车库清水混凝土施工质量和立面效果,介绍了方案优化、前期策划、模板选择、现场施工管理等大面积清水混凝土施工技术,取
目的分析中药热奄包配合推拿手法治疗项背肌筋膜炎的临床疗效,为项背肌筋膜炎临床治疗方案的制定提供参考依据。方法选取2018年8月2019年6月江西中医药大学附属医院骨伤科收治的153例项背肌筋膜炎患者为研究对象,按照随机数字表法分为对照组1、对照组2、研究组,各51例。对照组1采用中药热奄包治疗,对照组2采用推拿手法治疗,研究组采用推拿手法+中药热奄包治疗,其中对照组1中49例完成研究,对照组2和研
备份是电子文件安全管理的重要手段,其中脱机备份作为备份中安全等级较高的方式,成为了保护电子文件安全的最后一道壁垒。但是,我国目前对电子文件脱机备份理论研究不够系统,
基坑开挖作为一项成熟的工艺,在地铁端头井施工中已得到广泛应用。针时某一具体项目,通过开挖方案优化和实施支撑爆破拆除等技术方案及施工参数的调整优化,在实施中被证明对控制
通过最小点火能测定实验台测出常温下五种转炉煤气的最小点火能,实验结果表明随着CO当量比的增加最小点火能先减小后增大,最小值出现在CO 当量比为1.5 左右,且随着五种转炉煤