图像检索中自动标注、标签处理和重排序问题的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：shan43512

【摘要】

：

近年来,随着数码拍照设备的普及以及网络和存储技术的发展,网络中图像的数量呈现出爆炸式的增长趋势。特别是伴随Web 2.0技术的出现,海量用户产生的图像得以通过社交分享网站

【作者】

：

崔超然

【出处】

：

山东大学

【发表日期】

：

2015年期

【关键词】

：

图像检索图像标注标签相关度学习标签推荐图像重排序排序学习结构化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着数码拍照设备的普及以及网络和存储技术的发展,网络中图像的数量呈现出爆炸式的增长趋势。特别是伴随Web 2.0技术的出现,海量用户产生的图像得以通过社交分享网站(如Flickr和Instagram)被分享和传播。与此同时,互联网中图像资源的快速增长也催生了对高效的图像检索系统的需求。现有的商用图像检索系统需要依赖图像附加的文本信息来为用户提供检索服务。但是,人工进行图像标注的过程费时费力,因此自动图像标注技术受到图像检索领域的广泛研究。另一方面,对于社交分享网站中的图像,用户提供的标签往往不能准确且全面地描述图像的真实内容,因而也难以作为图像检索中可靠的索引关键字。因此,图像检索研究中的一项基础研究是来处理图像的标签信息,特别是提高标签对图像内容的描述能力。除此之外,由于仅利用了图像的文本信息,现有的图像检索系统返回的结果往往并不能令人满意。因此,如何基于图像的视觉信息对原始的检索结果进行重排序也是图像检索领域的重要问题之一。本文展开了一系列研究工作来提高当前图像检索系统的性能,详细讨论了图像标注、标签相关度学习、标签推荐和图像重排序这四个重要问题。论文的主要工作和创新性可以归纳为以下几个方面：(1)本文提出了一种新颖的图像标注方法,该方法同时改进了基于近邻的方法中的两个阶段。在近邻搜索阶段,不同于现有的方法通过预测距离来发现视觉近邻,我们介绍了一种面向排序的近邻搜索机制,采用排序学习框架来直接优化已标注图像相对于待标注图像的相对顺序,而非它们之间的绝对距离。在排序过程中,我们利用了已标注图像中隐含的偏序信息并强调高位置的排序结果的准确性。在关键词传递阶段,不同于现有的方法采用简单的启发式规则来选择传递关键词,我们介绍了一种基于学习的关键词传递策略,利用监督学习技术来学习一个可以评估候选关键词相关度的得分函数。关键词的相关度是根据它与待标注图像的视觉近邻之间的不同关系来决定的。在Corel 5K和MIRFlickr数据集上的大量实验证明了该方法的有效性。(2)本文提出了一种面向排序的标签相关度学习方法,该方法从排序学习的角度来解决标签相关度学习这一问题,并在学习过程中直接优化基于标签的图像检索的排序性能。具体来说,我们将监督学习的步骤引入到近邻投票策略中,该策略通过累积视觉近邻的投票来估计一个标签的相关度。通过明确地建模视觉近邻的权重以及标签之间的相关系数,我们的方法有效地避免了传统的非监督学习方法中进行启发式假设的风险。此外,我们的方法也解决了传统的监督学习方法中的可扩展性问题。通过在两个基准数据集上与其他先进的方法进行比较,我们证明了本文的方法的有效性。(3)本文提出了一种结合相关性和多样性的图像标签推荐方法。以往的图像标签推荐方法往往利用标签间的共现信息来进行标签推荐。但是,由于忽略了图像的视觉信息以及被推荐标签之间的语义多样性,以往方法的推荐结果常存在标签歧义和标签冗余的问题。为了解决上述问题,我们的方法在推荐时综合考虑了被推荐标签的相关性和多样性。首先,方法建模每一个标签的视觉语言模型,并利用它来分别计算标签和图像的相关性以及标签之间的视觉距离。然后,基于上述计算,我们提出了一个贪心选择算法来找到能合理地平衡相关性和多样性的标签集合,将该集合作为最终的推荐。在Flickr数据集上的实验表明,本文的方法在准确率、主题覆盖率和F1测度上均优于其他先进的方法。(4)本文提出了一种结合相关性和多样性的图像重排序方法,该方法是一个基于聚类的重排序方法,综合了已有的相互投票算法和贪心选择算法的优点。我们的方法利用相互投票算法在原始搜索结果中选择一些图像作为候选代表图像,并利用一个受限制的贪心选择算法来选择最相关且最有新鲜感的图像作为聚类中心。为了计算图像间相似度,我们结合了包括颜色、形状特别是潜在主题模型在内的多种特征,并详细讨论了结合不同特征的好处。我们在真实的Web图像数据集上对本文的方法进行评估,实验结果表明本文的方法可以从聚类召回率、NDCG和F1值等不同方面来提高用户满意度。

其他文献

基于Web图像的Kinship关系验证研究

计算机视觉系统的最终目标是要获得自适应能力、自学习能力、在各种解决方案中权衡的能力、对新的上下文情景和应用场合进行泛化的能力,以及和其它系统(包括人)进行沟通的能

学位

人脸验证亲属关系验证网页图像有监督表示学习特征选择模型设计小样本问题多任务学习多视图学习空间正则化

转型期上海闵行区存量土地开发模式探索

本文结合闵行区新一轮总体规划的编制工作,在深入剖析闵行区增量发展的各个阶段基础上,识别制约当前发展的三大重要瓶颈。基于相关理论、研究与实践,对闵行区现存的主体过多

会议

存量土地再开发闵行区总规政策机制

从标签理论解读艾滋病歧视

在标签理论的视角下,HIV/AIDS人员受歧视源于其被贴上不良标签,而标签化又使HIV/AIDS人员的种种权利受到侵害,使其对自己丧失信心,逐渐形成不良的自我形象,导致进一步的越轨

期刊

标签理论艾滋病歧视标签化形象互动去标签化

科学发展评价体系的逻辑思考

利益分配是科学发展评价体系的基础，社会关系是本质，规则是核心，理念是灵魂；四者以丰富的内涵和紧密的逻辑关系，架构成科学发展的评价体系。本文通过揭示四者在科学发展评价体系中

期刊

科学发展评价体系逻辑思考

高质量建设新时代大国税收

<正>今年是改革开放40周年,也是国际税收40周年。在我们进入建设新时代中国特色社会主义的伟大历史时刻,回顾这段难忘的历史,展望国际税收的发展前景,对于适应新时代需要,高

期刊

“走出去”企业反避税企业“走出去”税收治理国际税收合作

企业财务危机预警系统——筹资活动预警浅析

随着我国市场经济的深入发展，企业间的竞争日趋激烈。在激烈的市场竞争中，影响企业生存的主要威胁均来自其面临的财务风险和危机。本文提出了筹资活动环节设置预警指标和警度、

期刊

财务危机筹资活动预警系统

5-氟-2-羟基苯乙酮席夫碱的合成及结构表征

为进一步丰富甲基酮类席夫碱的种类,以5-氟-2-羟基苯乙酮为原料,通过与盐酸氨基脲、苄胺、邻苯二胺和4-氨基安替比林的缩合反应合成了4种新的5-氟-2-羟基苯乙酮席夫碱,并采用

期刊

5-氟-2-羟基苯乙酮席夫碱合成结构表征

经阴道超声检查肠蛔虫3例报道

<正>人蛔虫是一种最常见的人体消化道寄生虫,引起蛔虫病。蛔虫成虫寄生于人体小肠,夺取营养,也可引起肠梗阻、肠扭结、肠穿孔、胆道感染和阻塞引起阑尾炎等急腹症,甚至还可以

期刊

经阴道超声检查肠蛔虫强回声

图像内容显著性检测的理论和方法研究

人类的视觉系统可以在广大的、复杂的动态及静态场景中快速定位出最吸引注意的内容,这种能力被称为显著性检测。吸引注意的内容因此被叫做显著性(内容),一般来说显著性的某种

学位

显著性检测显著性特征显著性扩散物体检测图像分割

我国家电产业竞争力与反倾销指控的关联性和对策分析

[摘要] 近几年来，我国经济发展迅速，外贸出口持续快速增长，但遭遇的反倾销案件也与日俱增。本文从产业竞争力的角度，分析我国家电产业竞争力与反倾销之间的关系，以此防范反倾销对提升我国家电产业竞争力带来的不利影响。　　[关键词] 产业竞争力反倾销关联性分析对策　　　　一、产业竞争力的定义　　产业竞争力是产业内企业竞争优势的集中体现。从这个角度出发，产业竞争力是由单个企业竞争力、规模效益竞争力和企

期刊

产业竞争力反倾销关联性分析对策

图像检索中自动标注、标签处理和重排序问题的研究

其他学术论文