论文部分内容阅读
作为智能化信息处理的关键环节之一,目标识别在计算机视觉和模式识别等领域已成为重要且异常活跃的研究方向,其终极目标是无限接近甚至在某方面超越生物视觉能力,这也激发了对生物视觉感知机制及其智能性进行研究的兴趣。经研究,生物视觉特性主要表现为:视觉注意是智能的开关;记忆是蕴藏智能的前提;学习是智能提升的必要条件;特征联想是智能的具体反应;意识是智能的终极表现。本文对生物视觉感知系统的两个关键环节——信号稀疏性和视觉注意性进行深入学习并开展研究工作,将其运用于目标分类识别系统。其中,重点研究了目标特征的稀疏表示、基于学习的超完备特征字典设计、基于显著性及多特征分析的目标候选区域检测、结合“分层最大化”空间金字塔匹配的目标识别关键技术等问题,具体内容如下:(1)针对如何提取出表征目标的本质、关键属性的问题,基于视觉感知机制的有效编码假说,研究了稀疏表示理论并给出具体实现过程。详细分析了稀疏表示理论在目标分类、识别中的应用:利用已有的稀疏表示及字典学习算法,设计了基于Patch的、具有明显区分能力的超完备特征字典,并将其用于目标分类识别从而验证了对目标特征进行稀疏表示的有效性和可行性。得出结论:稀疏表示具有一定的判别特性;对目标特征的缺失具有一定的“容忍”能力;稀疏编码的合理运用可使目标对特定特征的依赖程度降低。(2)针对视觉注意机制,分析了视觉显著性的研究进展及应用现状;重点介绍了几种经典的模拟视觉注意机制的显著性模型——IT、FT、SR、RC、HC及IS,并对IS模型描述大目标显著性不理想的情况,提出一种结合空间相似性信息的改进IS显著性分析算法。经实验结果对比分析,该算法对大目标的显著性区域表达能力比IS模型理想。(3)考虑到传统目标识别模型缺乏通用性、未与生物视觉感知机制进行有效结合等问题,本文在贝叶斯模型框架下设计了基于视觉显著性及多特征分析的目标候选区域检测算法。其中,多特征结合能有效表征目标以使目标更具可区分性;视觉显著性分析可使算法具有对目标所在区域的主动选择性;此外,算法在一定程度上考虑了通用性问题。(4)阐述了几种典型的目标分类、识别模型——BoW、SPM、HMAX、DPM和贝叶斯框架模型等,重点研究了空间金字塔匹配模型(SPM);由于上述基于视觉显著性及多特征分析的目标候选区域检测算法结果存在着表征目标能力不强的候选区域,故在此基础上,进一步在“分层最大化”思想下设计了空间金字塔匹配结合稀疏编码及显著性的目标分类、识别方法。其中,引入稀疏编码是为了更好描述目标特征,使目标表述更具可区分性;“分层最大化”可在一定程度上保证提取到的特征具有局部空间变换“不变性”;显著性分析可剔除掉表征目标能力不强的候选区域,从而提高系统性能。综上,本文针对目标分类、识别问题,模拟生物视觉感知机制中的信号稀疏表示特性及视觉显著性,对稀疏编码及显著性信息分析如何用于目标分类、识别领域等关键问题进行了探索,实现了类生物视觉特性的目标识别功能,达到了课题既定研究目标,为进一步开展研究提供了一定理论基础和借鉴价值。另外,结合生物视觉感知机制其他特性,对现有理论知识、模型、算法进行有效整合,在保证理想的目标检测效果的前提下同时实现高效性是进一步值得深入探索的问题。