论文部分内容阅读
对于视频运动对象的检测与跟踪一直以来是计算机视觉领域的研究热点和难点,其目的在于检测和分割人们感兴趣的运动对象,并随着视频序列进行跟踪处理。该技术被广泛应用于视频检索、智能监控以及模式识别等相关领域。大多数运动目标检测与跟踪技术是在像素域对其进行研究的,然而,一方面像素域信息量大,需要处理海量的信息,无法满足对于实时性的要求;另一方面,随着多媒体技术的日新月异和视频压缩标准的迅速发展,视频信息一般以压缩的形式存储与传输,因此对于压缩域的运动目标进行检测跟踪的研究具有理论需求与实际意义。在压缩域进行运动目标的检测与跟踪只需要部分解压视频码流,相比于完全解压视频来说其耗时要少的多。另外,压缩域中主要以块作为单位信息,其信息量远少于像素域的像素信息,因此也潜在减少了处理视频信息的巨大运算开销。本文主要研究基于H.264编解码标准的压缩域运动目标检测、分割以及跟踪算法。首先提出一种基于阈值的压缩域目标检测方法。通过研究H.264压缩域的码流信息,在部分解码的情况下提取压缩域下的运动矢量信息,并对运动矢量场进行预处理,再根据运动矢量区域块时域相关性这一特性进行基于阈值的运动目标检测,应用于背景静止的视频序列。其次,本文提出了一种基于粒子群聚类的压缩域目标分割方法,本文将聚类的思想引入压缩域运动目标分割中来,利用改进的粒子群-K均值聚类算法对H.264压缩域预处理后的运动矢量进行聚类,并使用压缩域中宏块层信息对噪声进行处理。该算法不但适用于背景静止的视频序列,也可分割背景运动的视频运动对象。最后,本文提出一种基于压缩域的运动目标跟踪方法,以运动矢量的方向角特征作为系统观测量,通过粒子滤波估计算法对目标的状态进行估计求解,得到最终的跟踪结果。该算法受噪声影响较小,但对于目标的运动方向的突变较敏感。