基于词袋模型的物体识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:tom95800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体识别是目前计算机视觉领域中最活跃的研究方向之一。物体识别具有良好的应用前景,日益激增的军用和民用需求,智能导航,互联网中海量的基于内容的检索,陪护机器人,图像自动标注等,识别物体的能力是满足这些需求的应具备的基本功能之一。随着人工智能与模式识别技术的不断进步,现有的物体识别技术取得了不错的效果,但是仍存在一些问题。现有的算法,有基于图像底层全局特征的,但无法克服背景,遮挡,尺度和角度变化带来的干扰;有基于部件与结构的,往往忽略图像中的部分与部分之间的位置信息。图像局部特征具有计算量小和信息含量高的特点,其中尺度不变特征变换(Scale Invariant Feature Transform,SIFT)描述子在物体识别中应用广泛,但是图像中提取的SIFT特征点个数往往不定,无法直接输入至分类器中进行训练识别。词袋模型在局部特征基础上,将图像任意维数的局部特征向量集表示为一个固定维数的向量并作为机器学习算法的输入,完成识别任务。近年来,基于图像局部特征的词袋模型在场景及物体识别方面取得了辉煌的成果。但是基本的词袋模型无法从背景上得到物体的形状或者分割,因为该模型是前背景不分的.另外该方法完全忽略了图像局部特征的空间信息,在描述上也有一定的局限性。本文就物体识别面临的困难,综合考虑局部特征和词袋模型的优点,对基于词袋模型的物体识别方法进行研究,并进行了改进,旨在一定程度上解决传统词袋模型存在的问题,经实验分析,证明了本文提出的方法的有效性。本文的主要研究内容和创新点如下:(1)针对构建词袋模型的视觉单词即图像局部特征所表现的不稳定、不可靠、受背景影响问题,提出一种基于显著区域词袋模型的物体识别方法。本文避免使用复杂的图像分割技术,利用局部不变特征检测算子检测特征点,根据不变性特征点的分布定位出图像的感兴趣区域。在感兴趣区域提取局部特征,能有效减少与物体无关的特征点,确保提取的特征点能有效反映物体的本质信息,滤除来自背景上的特征点带来的干扰。(2)受空间金字塔模型的启发,提出一种基于多方向空间词袋模型的物体识别方法。为充分利用图像子区域间的空间关系,对局部子块进行多方向投影,得到图像空间结构信息,并联合样本视觉词典,使最终的特征表示更富于视觉意义。在公共物体识别数据库上进行了实验,实验结果表明,改进算法能有效提高词袋模型在物体识别中的性能。
其他文献
随着信息技术的快速发展,数据在医疗、商业、民生、科研与军事等领域都呈现出爆炸式增长,数据密集型计算环境下数据挖掘算法的研究已被越来越多的人所关注。数据密集型计算环境
数字图像处理、分析与机器视觉是认知科学与计算机科学中的一个令人兴奋和活跃的分支,在人的感知、识别和理解中,形状是一个非常重要的参数,而链编码就是以此概念延伸的一种形状
随着彩铃业务的成熟和发展,如何有效地存储和管理大容量的铃音数据成为了一个重要的技术问题。本文提出新增铃音服务器网元作为集中式铃音数据存储方案,利用高效的磁盘缓存算法
流媒体正在成为推动未来宽带应用的主动力。但目前来讲流媒体的质量还不能令人满意。在传统的C/S模式下服务器很容易成为系统瓶颈,如何在Internet网络上提供大规模的流媒体内
学位
近年来,以关键词、短语、概念等特征项为基础的信息检索、搜索引擎、文本挖掘、信息抽取等信息获取技术得到广泛研究和应用。信息获取可从海量的、良莠不齐的数据中获取粗信息
本文主要介绍了一种多CCD专业扫描仪驱动软件的系统结构设计及其实现方案。因为特殊的需求,与普通家用和办公扫描仪相比,专业扫描仪在硬件和驱动软件上都存在着很大的不同,比
随着电子、计算机、信号处理等技术的发展,超声焊缝检测已逐步从传统的手工检测方式进入了自动检测与计算机辅助识别的时代。本文主要针对中小模数齿轮环焊缝超声自动检测系
信息隐藏是一门涉及感知科学、信息论、密码学等多个学科领域的交叉学科。信息隐藏的分类方法繁多,按照嵌入域可以分为空间域方法以及变换域方法,其中常用的变换域方法包括离散
图像显著性检测是很多图像处理领域的重要步骤,它是图像分析,特征提取和探索人类视觉特性的综合过程。显著区域检测对各种基于图像分析和图像理解的应用,比如基于内容的图像
在实际信息检索系统中,信息检索系统的查全率和查准率都不是很高,针对不同的文献集,信息检索系统的性能也不一样,很多系统尽量适应各种文献的检索,这样性能就更加低效,与其说使检索