论文部分内容阅读
随着计算机技术、网络技术及多媒体技术的发展,数字视频的应用越来越广泛,如何从这些海量数据中快速地查询自己感兴趣的数据,已成为人们关注的焦点。基于内容的视频检索正是在这种情况下提出来的。本文重点研究了基于内容视频检索中的镜头检测和场景检测,并取得了如下成果:系统地分析了已有镜头检测算法和场景检测算法,并利用小波变换提取了视频帧的颜色信息和纹理信息,结合视频帧颜色信息的互信息量和纹理信息的联合共生互信息量检测了视频中的切变镜头边界。提出了一种划变检测算法,首先根据划变的颜色特征,即后一个镜头的帧逐渐覆盖前一个镜头的帧进行划变检测,然后利用Hough变换检测对应的视频过程中是否出现椭圆或直线有规律地变化,来确认对应的视频区域是否为划变。根据叠化和划变的编辑模型,给出了这两种渐变类型的检测算法。在理想的叠化模型中,叠化过程的方差一阶差分有规律地变化,本文根据这个特征检测侯选叠化区域,但是,物体及摄像机的运动有时也会导致类似的的曲线变化规律,所以本算法又根据叠化的另一个特征即连续一致性变化对视频区域进行确认。对于划变,本文首先将划变分为线性划变和二次划变,然后分别对它们进行检测,实验结果表明本文所提算法具有较高的性能和效率。为了提取镜头的关键帧,本文给出了动态帧的定义,指出了动态帧中各像素灰度值应该具备的特点及动态帧的构造方法,然后通过计算镜头中各帧与动态帧的距离来确定镜头的关键帧,该方法具有较高的保真度和压缩比。相对于镜头检测,场景的检测更加困难,这主要是因为镜头是对视频的一种物理分割,而场景是对视频的一种语义分割,本文在检测镜头关键帧的基础上,首先对镜头进行组合,然后分析了实际视频中场景的不同类型,根据各镜头类之间的相关系数,对镜头类进行了组合,构造了场景,最后对包含较少镜头的场景进行合并,实验表明该算法检测的场景和人工判断的结果很接近。