论文部分内容阅读
随着多媒体通信技术的发展,海量的多媒体数据逐渐成为信息处理与传输的主要对象,尤其是视频图像数据。在各个应用领域,每天都有数十亿比特的视频数据产生;在许多特定的应用领域,如视频监控,图像检索等,需要对视频图像进行快速分割,提取特征,从而进行匹配检索;由于视频数据量大,其表达、存储、传输、组织具有很大的难度,如果不能合理地组织这些视频数据,要有效地检索这些信息是不可能的,这是当今最具挑战性的研究课题之一,是多媒体通信技术的研究热点。基于内容的视频图像检索(CBIR)是有望解决这一问题的关键技术,是计算机视觉和图像处理领域中非常活跃的研究课题之一。本文根据现有的视频分割技术的特点,即把图像分成各具特性的区域并提取出感兴趣目标,然而在缺乏足够先验信息的条件下对图像进行分割处理比较困难,特别是对于运动序列,需要考虑前后两帧直接的关系,运动估计以及冗余信息等等;由于分割对边界的划分敏感,因此在最终的分割结果中,造成一定的欠分割与过分割问题;现在主流的有半监督与非监督条件,在半监督情况下的图像中的类别数目是手动划分确定的,而非监督条件中的分类数目是需要系统自动确定的,因而在很大程度上增大了自动分割的难度。而对于视频检索技术,由于视频数据的庞大,在数据管理上提出了很高的要求,特别是对于实时的视频检索,速度与准确性是非常严格的要求,而系统中关键帧的提取,目标特征的提取,相似度准则,查询特征函数等是视频图像检索中的关键技术,也是当前研究的重点和难点。本文对基于内容的视频图像检索技术中的几个问题进行深入研究,取得了如下结果:首先,针对图像及序列分割中特征选取以及分类的问题。对以往分割算法中特征提取单一且描述不充分的缺点,提出了基于马尔科夫随机场的图像分割,将纹理和颜色特征相融合,利用马尔科夫随机场建立图像分割模型,实现对象分割;针对视频图像中帧间差值算法不能准确分析各运动对象的运动变化趋势,结合对象的运动估计,提出了一种基于仿射模型的运动对象特征提取以及马尔科夫随机场模型的特征分类模型,从而实现了图像和视频序列的区域分割方案。其次,在图像查询特征有效提取及检索策略方面。本文深入研究了小波变换的特性,提出了多带小波的图像特征提取,运用聚类技术实现特征分类,通过相似度准则计算匹配图像,得到检索结果;针对当前主流的相关反馈机制,结合现有的研究算法,综合特征融合及特征的降维处理方法,提出了分层特征结构,并将空域和频域特征融合的图像检索方法。再次,在视频图像检索中特定目标的检测与识别技术方面。本文详细分析了基于统计特征在人脸识别中的应用,对人脸图像和非人脸图像分别进行统计建模,结合运动序列中仿射模型特征,采用贝叶斯分类器与支持向量机分类器进行分类优化,提出了基于贝叶斯特征的视频人脸图像检测技术,实现了基于嵌入式隐形马尔科夫随机场模型的人脸图像识别技术,并对其中的决策函数进行优化。通过实验仿真证明系统的有效性。最后,在视频检索系统的数据结构设计方面,针对视频信息的特点,通过交互信息量提取视频序列中的关键帧,采用元数据信息特征进行信息分析及存储,并详细介绍了元数据信息的生成及结构化处理,提出了基于人脸特征与元数据相结合的人脸图像视频检索策略。