论文部分内容阅读
视频检测、跟踪、识别一直是智能监控、视频检索、模式识别相关领域研究的热点,这些技术与现代生活密切相关,受到了广泛的应用。其中视频目标检测作为跟踪、识别等高级处理的前序步骤,处理的精度与速度直接影响到后续工作能否顺利进行。当前检测算法的研究如果按照检测素材进行分类,可以分为使用像素信息作为基本元素进行检测的像素域检测,以及使用运动矢量、DCT系数等信息作为基本元素进行检测的压缩域检测。本文针对实时性应用,分别对压缩域及像素域检测算法进行了一定研究。在压缩域,本文基于H.264编解码标准,研究了如何从未完全解码的H.264视频流中提取运动矢量,并对矢量进行预处理,得到显著的矢量场作为检测的基本元素。基于得到的矢量场,本文提出了一种改进的压缩域聚类检测方法,通过对矢量进行特征提取,并对矢量场进行分层聚类来得到最后的目标区域。实验证明此改进方法相比原始EM聚类的压缩域检测方法,提高了检测速度,并且能够有效消除光影噪声区域,此外该改进算法还能有效克服目标暂时静止而无法被检测的影响。压缩域的优点在于未完全解码状态就能够开始检测处理,且数据量相比像素域更少,从两方面提高了检测的效率。但压缩域使用每一个4X4像素块的运动矢量作为基本的检测元素,相比像素域以像素作为基本的检测元素,检测精度具有一定局限性。像素域处理历史悠久,理论研究较成熟,但对于越来越高质量的视频应用,对于海量的像素数据,传统的像素域检测方法无法在保证精度的同时,满足实时性要求。本文基于变换检测提出了一种改进的像素域检测算法。通过视频序列累计出可靠的背景缓存,通过当前帧与背景缓存的差异来得到目标区域。该算法相比传统分水岭等像素域方法具有高效、易于并行,流水线处理等硬件实现的优点。从实现角度来说,对于目标检测,因为各种复杂的应用环境,出于灵活性以及成本等因素的考虑往往与跟踪、识别等高级处理一起用CPU来处理。现场可编程门电路FPGA作为一种半定制的芯片,比起仅使用CPU处理的系统,虽然会增加额外系统成本,但它可以根据特定算法进行优化,充分利用并行性流水线等硬件实现的优势。针对有实时性的应用,利用FPGA来实现视频前处理、检测等算法可以大大提高处理速率。本文基于FPGA平台,使用数字图像传感器作为输入,显示器作为输出,SDRAM作为处理缓存,在FPGA内部设计了传感器配置、图像同步、图像色彩空间转换、数据调度、SDRAM控制、VGA输出、检测等逻辑模块。实现了基于上述背景寄存检测算法的检测系统。该系统在满足实时性要求的同时,较好的完成了检测任务。