论文部分内容阅读
物体识别是计算机视觉领域当中的一项重要研究,已广泛应用于工业检测、交通监管、遥感、生物医学等领域。随着信息科学技术的不断发展,物体识别的准确率和速度在不断提升。实现高速、实时的物体识别成为该技术研究的主要方向之一。传统的物体识别技术,通过获取物体的图像,从图像中提取物体的特征,将特征进行匹配来实现物体的识别。但针对于高速运动物体的识别问题,需要提高时间分辨率来快速获取物体图像。随着人工智能和深度学习技术的不断发展,卷积神经网络被应用于物体的识别。通过训练卷积层中的卷积核,可以准确地提取物体中的特征,从而对物体进行识别。相比于传统的方法,深度学习技术在物体识别任务上具有更高的准确性、更强的鲁棒性和更快的识别速度。目前基于深度学习的物体识别技术依然依赖于物体图像的获取。高速相机由于具有较高的时间分辨率,通常被用来获取运动物体的图像。然而高速相机在数据存储、传输带宽和计算方面是有一定限制的,这使得高速运动物体的长时间的、实时的识别具有了挑战性。为此,本文提出了基于单像素探测和深度学习的物体识别技术,并进行了实验验证。提出的方法在物体信息获取阶段进行信息压缩,对物体的特征信息进行采样,不需要获取完整的图像信息,减少冗余信息的采集,提高了信息获取效率。首先,提出使用傅里叶单像素欠采样成像的方法,在成像阶段进行数据压缩,保留图像的部分特征。通过仿真训练使卷积神经网络来适应欠采样成像的结果,通过实验完成了在5%的图像频域采样下速率为24fps的动态手势识别,识别准确率达到了91.8%。其次,在单像素成像技术的基础上,分析了将空间光调制器与单像素探测器相结合的系统,提出了一种免图像的物体识别方法。使用卷积神经网络来生成自适应的物体特征结构光图案。利用空间光调制器投影特征图案,将目标物体的特征信息压缩成一维光强信号,并以物理的方式完成了网络中的卷积操作。得到的一维信号由单像素探测器采集,并直接反馈给神经网络进行识别。针对运动物体场景,通过实验完成了运动速度为5.66m/s的手写字符识别,识别速率达到了595fps,准确率达到了96.88%。提出的免图像物体识别方法节约了96.17%的数据存储量,实现了实时的运动物体识别。本论文提出基于单像素探测和深度学习相结合的物体识别技术,具有结构简单、紧凑的优点,该技术不需要获取完整的图像信息就可以实现准确的物体识别。该技术突破了高速相机工作时间较短的限制,减轻了图像存储、传输、处理的计算消耗,可实现大量、实时、快速运动物体的识别。单像素探测器的使用使得所提出的方法能够在非可见光波段、弱光、超视距、散射介质中工作。因此,该技术在工业检测、生物医学、军事等领域中有潜在的应用前景。