论文部分内容阅读
室内场景的识别与理解是智能化信息处理的关键技术,相关研究成果已经在不同的领域投入广泛的应用,主要包括安防领域的行人检测、目标追踪、人脸识别等,互联网信息领域的图像内容检索,智能机器人领域的目标找寻、场景理解、障碍物检测等,给人类日常生活和工作的很多方面提供了便利,具有重要的理论研究意义和工程应用价值。本文以基于视觉感知的室内场景目标检测与场景识别为研究重点,主要研究内容如下:1.从有效的局部特征梯度直方图为入手点,研究可变形部件模型(Deformable Part-based Model,DPM)的组成、多尺度下的匹配和评分方法。对模型的训练方法进行了深入探讨,使用坐标下降算法,结合筛选困难负样本进行隐性变量支持向量机的训练。因此,目标检测可以在不同尺度、目标的不同部分进行实现,使得检测方法对目标的姿态变化、局部位移造成的形变有很好的鲁棒性。同时,研究通过径向基编码融合特征上下文(Feature Context),使可变形部件模型能够利用更多的上下文信息,并通过实验与其它优秀算法进行对比,验证可变形部件模型优于其它算法,且特征上下文的融合提高了模型的检测性能。2.深入研究使用可变形部件模型获取拥有更强描述能力的场景特征,同时克服需要手工标注感兴趣区域(Region of Interest)的缺陷,通过调整其训练、匹配方法和参数,将其应用于室内场景识别。通过实验分析讨论了调整方法,以及模型的不同参数在室内场景识别中发挥的作用和影响。3.针对DPM模型对全局场景把握不足的缺点,引入基于特征通道的视觉感知场景gist特征,重点研究了强度、颜色、方向等不同视觉特征通道的gist特征提取,并基于softmax回归进行场景特征融合和识别分类。通过实验验证了特征融合对识别性能的提升,对比分析了改进的识别方法对室内场景识别的优势。