基于视觉和语义信息的图像标注方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:hitlic2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,各种存储媒介中产生的海量图像在极大的丰富人们视觉生活的同时,也为图像的管理带来了许多的不便。由于大部分的图像是通过数码产品拍摄,通常只是具有简单的数字序列名称或者英文与数字混排的名称,不能充分反映图像的视觉内容,使用传统的TBIR方式也很难在海量图像中获取指定的目标图像。因此,对图像实行自动标注,使图像名称能够真实反映视觉内容的AIA研究工作显得格外重要。自动图像标注方法研究在图像管理、图像检索和图像理解等领域都具有重要意义,目前已成为新的热点研究课题。通过了解目前各类图像标注模型思想,以基于场景语义的pLSA-GMM标注方法为基础开展研究,构造了一种结合语义信息和视觉信息的AIA-SSBTM模型,并通过该模型将标注字赋予未知图像。AIA-SSBTM模型将标注分为训练和标注两个阶段。在训练阶段,模型对训练数据集在语义层进行场景分类,并对每个场景在视觉层进行二叉树的构造,分别得到语义层数据集和视觉层数据集,在标注阶段,模型首先判定未知图像的归属类别,然后使用该类别的二叉树模型和对应的方法完成标注。本文模型利用图像之间的相似性将不同类别的场景图像构成图结构,然后使用Ncut方法进行二叉树构造,图像之间的相似性度量也是本文的主要研究问题。通过对图像分别在底层视觉特征和高层语义信息进行相似性度量的利弊分析,设计了一种结合视觉特征和对象语义的联合相似性度量方法,并将其应用在AIA-SSBTM的模型构造中,通过结合EMD方法和TF-IDF方法的联合相似性度量方法重新构造了模型中的二叉树结构。采用相似性联合度量方法重新构造的AIA-SSBTM模型的综合指标F-measure比原模型提高了7%。实验采用Corel5K数据库进行模型训练和测试图像标注,在4500张训练图像和500张测试图像的数据集规模内分析实验结果,将AIA-SSBTM在性能上与TM、CMRM、pLSA-GMM和CRM等标注模型进行比较,综合指标F-measure都有提高。
其他文献
无线自组织网络(WirelessAdhocNetwork)是一个由移动主机组成的,没有任何基础设施或集中管理的临时网络。无线adhoc网络中的每个节点都可以充当一台主机或者一个路由器。由于
粗糙集理论是Pawlak教授提出的处理不准确、不完整和不明晰信息的数学方法。模糊集理论是Zadeh教授提出的,用来刻画模糊现象以及模糊概念的数学工具。其后,Atanassov教授推广
随着图像采集技术、传感技术、互联网技术的迅速发展,现实生活中数字图像的数量呈现爆炸式的增长。面临数量巨大、内容丰富的图像数据库,如何从中准确、快速地检索到用户感兴
目标跟踪是计算机视觉领域的主要研究方向之—,在视频监控、军事制导、无人驾驶、人机交互等领域得到了广泛应用,深受研究者们的广泛关注。作为目标跟踪技术的一个重要分支,
在过去几年中,软件的构建、部署和运用发生了重大变化,RichInternet Application(RIA)将桌面软件的丰富功能与Web应用程序的广度结合在一起,提供良好的用户交互体验和更好的
随着医学影像技术的发展,医学影像设备在医院得到了广泛应用,积累了大量病人的医学图像数据及相关医学参数。利用数据挖掘技术挖掘出隐含在这些海量图像数据中的有用信息,不但可
随着网络的普及,在线文献系统也随之发展,出现了如DBLP、微软学术等以作者为核心的文献集成系统,而同名作者识别是该类系统亟待解决的问题。本文将作者识别分为作者重名消歧与实
随着社会经济生产发展的需要,高效安全的数字化采矿技术成为了是我国矿业生产的必然趋势。爆破是矿山生产过程中的一个主要先行环节。爆破矿岩的数量多少和质量优劣,对后续生
无线通信技术作为一种方便、快捷的通信技术,目前已经广泛地应用于人们生产生活的各个方面,例如因特网、手机、商业和医疗等。由于无线信道的不稳定性和无线信号多径传播的特点
科学技术和信息科学的发展带给人们全新的生活体验,但也给人们的安全带来了一些威胁。安全访问控制和授权技术成为研究信息安全的关键问题,在信息资源及用户庞大的信息系统中尤