论文部分内容阅读
随着多媒体技术得蓬勃发展,视频信息大量地涌现,传统的数据处理方式已经无法满足需求,如何在海量的数据中快速地检索出所需要的资料就显得至关重要。为了使人们能够更加方便快捷地寻找到视频数据,基于内容的视频检索技术引起了人们广泛地关注。运动目标检测与跟踪就是把图像处理、自动控制、信息科学等技术有机结合起来,形成的一种能够从图像信息中快速地检测出运动目标、提取目标位置信息并实时地跟踪目标的技术。它是有效的视频检索、检测的基础,可应用于工业、医学、军事、教育、商业、体育等视频检索、检测中。
本文在综合分析了视频结构和视频检索的框架基础上,对视频检索技术中关键技术-镜头分割以及运动目标检测与跟踪进行了深入研究,提出了一些改进和新的方法,并开发相应的原型系统,具体内容如下:
(1)分析了常见的各种镜头分割方法,给出了一种改进的自适应滑动窗口双阈值镜头分割算法。该算法采用HSV颜色空间作为特征描述空间,并且将该空间划分成三个子空间,分别为色调H子空间、饱和度S子空间、亮度V子空间。利用三个子空间在镜头转换类型中所体现出的不同特点,自适应的分配子空间权值,突出变化巨大的子空间,使得镜头边界处和镜头内部运动更加容易区分。最终通过实验对几个算法进行了比较,验证了本算法的有效性。
(2)针对复杂背景下的多目标检测和跟踪问题,提出了将背景差分目标检测算法与高斯金字塔图像重采样相结合的运动目标检测算法。该算法采用高斯金字塔法对图像进行重采样,建立背景模型,使用背景差分法获得前景区域,并对前景区域进行阴影检测、去除,从而检测出完整目标。融入了高斯模型关于背景更新的算法,克服了由于背景突然改变而造成的误检测。在目标阈值的确定过程中,采用动态阈值确定法,以提高目标检测的正确性。同时将目标的颜色特征和运动矢量引入到多目标跟踪算法中,以提高目标跟踪的准确性。
(3)为了验证上述方法的有效性,本文采用面向对象的设计方法,以VisualC++6.0和Matlab7.0为开发工具,实现镜头分割和运动目标检测与跟踪系统。该原型系统主要包括:视频预处理、镜头分割、特征提取、运动目标的检测与跟踪等功能。