论文部分内容阅读
物体识别是目前计算机视觉领域中最活跃的研究方向之一。物体识别具有良好的应用前景,日益激增的军用和民用需求,智能导航,互联网中海量的基于内容的检索,陪护机器人,图像自动标注等,识别物体的能力是满足这些需求的应具备的基本功能之一。随着人工智能与模式识别技术的不断进步,现有的物体识别技术取得了不错的效果,但是仍存在一些问题。现有的算法,有基于图像底层全局特征的,但无法克服背景,遮挡,尺度和角度变化带来的干扰;有基于部件与结构的,往往忽略图像中的部分与部分之间的位置信息。图像局部特征具有计算量小和信息含量高的特点,其中尺度不变特征变换(Scale Invariant Feature Transform,SIFT)描述子在物体识别中应用广泛,但是图像中提取的SIFT特征点个数往往不定,无法直接输入至分类器中进行训练识别。词袋模型在局部特征基础上,将图像任意维数的局部特征向量集表示为一个固定维数的向量并作为机器学习算法的输入,完成识别任务。近年来,基于图像局部特征的词袋模型在场景及物体识别方面取得了辉煌的成果。但是基本的词袋模型无法从背景上得到物体的形状或者分割,因为该模型是前背景不分的.另外该方法完全忽略了图像局部特征的空间信息,在描述上也有一定的局限性。本文就物体识别面临的困难,综合考虑局部特征和词袋模型的优点,对基于词袋模型的物体识别方法进行研究,并进行了改进,旨在一定程度上解决传统词袋模型存在的问题,经实验分析,证明了本文提出的方法的有效性。本文的主要研究内容和创新点如下:(1)针对构建词袋模型的视觉单词即图像局部特征所表现的不稳定、不可靠、受背景影响问题,提出一种基于显著区域词袋模型的物体识别方法。本文避免使用复杂的图像分割技术,利用局部不变特征检测算子检测特征点,根据不变性特征点的分布定位出图像的感兴趣区域。在感兴趣区域提取局部特征,能有效减少与物体无关的特征点,确保提取的特征点能有效反映物体的本质信息,滤除来自背景上的特征点带来的干扰。(2)受空间金字塔模型的启发,提出一种基于多方向空间词袋模型的物体识别方法。为充分利用图像子区域间的空间关系,对局部子块进行多方向投影,得到图像空间结构信息,并联合样本视觉词典,使最终的特征表示更富于视觉意义。在公共物体识别数据库上进行了实验,实验结果表明,改进算法能有效提高词袋模型在物体识别中的性能。