基于视觉感知的室内场景识别与理解

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:scg5252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
室内场景的识别与理解是智能化信息处理的关键技术,相关研究成果已经在不同的领域投入广泛的应用,主要包括安防领域的行人检测、目标追踪、人脸识别等,互联网信息领域的图像内容检索,智能机器人领域的目标找寻、场景理解、障碍物检测等,给人类日常生活和工作的很多方面提供了便利,具有重要的理论研究意义和工程应用价值。本文以基于视觉感知的室内场景目标检测与场景识别为研究重点,主要研究内容如下:1.从有效的局部特征梯度直方图为入手点,研究可变形部件模型(Deformable Part-based Model,DPM)的组成、多尺度下的匹配和评分方法。对模型的训练方法进行了深入探讨,使用坐标下降算法,结合筛选困难负样本进行隐性变量支持向量机的训练。因此,目标检测可以在不同尺度、目标的不同部分进行实现,使得检测方法对目标的姿态变化、局部位移造成的形变有很好的鲁棒性。同时,研究通过径向基编码融合特征上下文(Feature Context),使可变形部件模型能够利用更多的上下文信息,并通过实验与其它优秀算法进行对比,验证可变形部件模型优于其它算法,且特征上下文的融合提高了模型的检测性能。2.深入研究使用可变形部件模型获取拥有更强描述能力的场景特征,同时克服需要手工标注感兴趣区域(Region of Interest)的缺陷,通过调整其训练、匹配方法和参数,将其应用于室内场景识别。通过实验分析讨论了调整方法,以及模型的不同参数在室内场景识别中发挥的作用和影响。3.针对DPM模型对全局场景把握不足的缺点,引入基于特征通道的视觉感知场景gist特征,重点研究了强度、颜色、方向等不同视觉特征通道的gist特征提取,并基于softmax回归进行场景特征融合和识别分类。通过实验验证了特征融合对识别性能的提升,对比分析了改进的识别方法对室内场景识别的优势。
其他文献
随着互联网和信息技术的不断发展,以及经济全球化进程的加剧,企业间的竞争日趋激烈,为了提高企业的国际竞争力,信息化是唯一有效的途径。然而,目前企业信息化水平比较低,主要
基于ICT(工业计算机层析成像技术)的无损检测是目前公认的最佳的无损检测手段,但是,其在固体火箭发动机检测领域却尚未大范围使用,主要原因就是固体火箭发动机体积巨大,采用
H.264作为新一代的视频编码标准,具有众多技术上的创新。H.264凭借较高的压缩率、较好的图像压缩质量以及网络亲和性,无论是用于存储还是用于网络传输都能够胜任。但各种编码
本文的主要任务是研究某个区域内的多个蓝牙设备如何高效、自动地构成一个连通的散射网。蓝牙散射网是由具有蓝牙功能的设备组成一个不需要额外网络设备,在某个区域内自主协