基于深度学习的图像和文本检索

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 2次 | 上传用户:deiaw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网上图文数据的增多,图文检索受到了广泛关注。当前图文检索中面临着特征异质性和检索速度慢等问题,为了解决特征异质性的问题,本文提出了一种跨模态注意力机制模块来抽取更好的图文特征,该模块能够发掘图文特征之间相关联的信息,抽取出的特征能显著地提高图文检索的性能。同时为了提高检索时候的速度,本文用哈希来学习模态特征。跨模态哈希检索因拥有计算资源少,存储高效等特点,受到了广泛的关注。之前大部分研究工作是基于成对标签信息来生成二进制哈希码,而忽略了图文数据的类别标签信息。本文提出一种新的哈希码生成方法,该方法融合了图文数据中的类别标签信息。在算法中加入了类别标签损失函数来生成更好的哈希码。在三个图文数据集上的实验表明了本文方法有效性,特别是在IAPR TC-12数据集上,本文方法比当前最好的方法,在平均精度上提升了7.2%。同时,为了提升网络的运行速度,本文利用CCP对网络进行压缩,该方法在压缩AlexNet近20倍的情况下,能够保证网络的精度基本无损。
其他文献
餐饮业的每一个菜品都是精心打磨千挑万选后才推出的,但是大浪淘沙,总有跟不上时代或不适应消费者需求的菜品。那么如何砍菜单就是一门学问,可以通过大数据与波士顿矩阵(BCGM
随着无线通信技术的发展,数据速率增大和信号带宽增加的趋势给射频系统设计带来了困难。功放是发射机的重要组成部分,功放的行为模型和线性化技术受到关注。数字预失真(DPD)
塔里木油田碎屑岩储层经过多年注水开发,地层含水率较高,水淹现象严重,对油田储层的二次解释评价造成困难。本次研究结合研究区试油试采、生产动态等资料,对储层目的层段水淹
尼古拉斯·佩夫斯纳(Nicholas Pevsner)的《现代设计的先驱者—从威廉·莫里斯到格罗皮乌斯》作为设计史的开山之作,不仅在公众心目中确立了有关设计史研究的概念,也为之后设
明代通俗丛书的编纂服务于当时的社会生活,因而对于明代社会史研究有丰富的史料价值。明代日用类丛书中记载了明人在饮食、风水占卜和保健养生方面的生活知识,可以探究明代人
目的调查西安市阿尔茨海默病(AD)病人的经济负担,分析其影响因素。方法对119例AD病人及其照料者进行问卷调查,包括基本信息、直接医疗费用、直接非医疗费用等。结果AD病人平
当今国际集装箱航运市场发展迅猛,市场运力投放不断增加,兼并、联盟化趋向愈演愈烈,航线产品同质化现象日益严重。各航运公司普遍面临着客户基础差、忠诚度低、流失严重以及