基于深度学习的手绘草图检索及相关研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zhang11289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,互联网内容由最初的文本信息为主逐渐向各类富媒体数据发展,其中最主要的就是图像,但随着图像数据量的飞速增长,用户想要检索出所需要的图像就变得尤为困难,细粒度检索必然是未来图像检索的趋势,另外图片的多样性发展也让跨域图片检索在很多场景中具有应用,比如通过航拍图检索街景图,通过夜景图检索白天图等等。本文聚焦于手绘草图到图片的跨域细粒度检索。所以这里面需要解决的核心问题就是三点:首先是跨域检索,草图和图片在特征上具有明显的差异性,草图的特征和图片的特征属于不同的特征空间,本文需要解决的就是将不同的域的图像映射到相同的特征空间中;其次,要实现细粒度检索,即对于同一类的图片的微小的差异,检索系统具有非常敏感的识别效果;最后就是草图检索的效率问题,数据量的大规模发展让图像检索面临着存储空间和计算速度等问题。本文针对以上问题进行逐步的研究,通过研究相关论文和进行大量的实验,我们设计和构建了一种异构网络,具有两个结构不同的网络分支,分别适应草图和真实图片两个域的特征提取。由于目前不存在足以单独训练整个深度网络模型的数据集,所以我们采取了分步训练的方式,在训练集上,我们从粗粒度到细粒度上逐步训练,使用对比损失和三元组排名损失逐渐约束两个域的特征相似度,最终在细粒度检索上取得很好的效果,实现端到端的图片检索。提取了草图与图片的跨域特征表示之后,我们继续研究大规模数据下的草图检索效率问题,在已有的异构网络模型的基础下,我们设计了基于异构网络的深度哈希模型,在异构网络的最后一层设计哈希映射层,并对离散的二值哈希码进行跨域映射,为解决二值哈希码相似性约束的不可导性,我们研究了大量论文和方法,最终通过松弛的方式完成了损失函数的可导性。最终,我们在检索准确度,检索效率上都实现了比较大的提升效果。
其他文献
人工神经网络已经成为人工智能领域近年来最热门的研究方向之一,并成功地解决了机器人、工业、生物、医学和经济等领域许多实际问题。随着互联网及大数据时代的到来,神经网络
现代企业的竞争是人才的竞争、是知识的竞争。而员工培训的管理与创新是企业培育核心竞争力,取得不断成功的关键所在。本文围绕目前企业员工培训普遍存在的困难和问题,从树立
习近平在2014年文艺座谈会上的讲话联系文艺作品创作发展实际,针对文艺作品创作发展的新问题,提出了创作无愧于时代的优秀作品的要求。同时,作为电视文艺之一的综艺真人秀,在
山前高陡构造防斜打快问题是塔里木油田勘探开发中遇到的难题之一。结合该油田八盘1井的防斜打快技术实践,探讨了垂直钻井系统PowerV的工作机理和控制指令,分析其在控制井斜中
2011年11月30日,国家能源局网站向社会试开通,网址为www.nea.gov.cn。国家能源局网站是能源局在互联网上发布政务信息的重要窗口、提供在线服务的重要平台、增强政府同人民群
国漫电影《哪吒之魔童降世》(以下简称《哪吒》)在华语电影界留下了浓墨重彩的一笔,不仅荣获2019年的票房冠军,还凭借50亿票房位列中国影史榜第二位。在国内爆火后,《哪吒》