论文部分内容阅读
随着高性能计算机、宽带网络、多媒体、视频压缩和存储等技术的发展,视频数据得到了越来越广泛的应用,如视频点播系统(VOD)、数字化图书馆(DL)、媒体资产管理(MAM)等。近年来,基于内容的视频检索技术(Content-based Video Retrieval,简称CBVR)受到了越来越多的重视,已成为信息科学领域的研究热点。本文对基于内容的视频检索基本原理和关键技术进行了研究,主要工作如下:
1.详细介绍了基于内容的视频检索产生的背景及其应用价值,研究分析了基于内容的视频检索发展过程和国内外研究现状,并对其包括的关键技术和特点进行了阐述,同时介绍了几个典型的CBVR系统与CBVR技术的主要应用领域。
2.镜头检测是基于内容的视频检索首先要解决的关键技术,直接关系到一个CBVR系统性能的优劣,本文对此进行了详细的研究和分析。首先介绍了镜头变换的类型和检测算法的评价标准,其次讨论了几种典型的镜头检测算法并对其性能加以分析,然后分别提出了一种将模板匹配和直方图法相结合的镜头切变检测算法、一种基于奇异值分解和特征融合的镜头检测算法和一种改进的基于聚类的镜头检测算法,并对所提出的算法进行了详细的实验结果分析和讨论。实验结果表明,结合模板匹配和直方图的镜头切变检测算法以及基于奇异值分解和特征融合的镜头检测算法性能优于改进的基于聚类的镜头检测算法。模板匹配和直方图相结合的算法适用于切变检测,基于奇异值分解和特征融合的算法可同时对切变和渐变进行检测,改进的基于聚类的算法适用于镜头之间内容差异较大、镜头内部差异较小的检测。
3.镜头检测后,下一步的工作就是进行关键帧提取,用以描述镜头的主要内容。本文分析并讨论了目前关键帧提取技术存在的问题,提出了一种基于聚类技术和图像熵相结合的关键帧提取算法,研究表明该算法提取出的关键帧能够对镜头内容进行正确的描述。