论文部分内容阅读
随着计算机网络技术和数字视频技术的发展,视频资源越来越丰富,如何在视频的汪洋大海中选取需要的视频,这就要对视频摘要提出了要求。
本文主要研究了视频摘要中的两个技术:镜头边界检测和关键帧提取。镜头边界检测和关键帧提取时视频摘要技术的基础和关键,完整的视频摘要第一步就要时域分割,即完成镜头边界的检测。其次,同一镜头组的视频帧有很大的冗余,不适合用于检索和存储,所以需要提取重点帧,既要消除镜头的冗余,又要很好地代表镜头的主要内容。
本文分析目前存在的各种镜头边界检测算法之后,分析了各种视觉特征(各种颜色空间的直方图,主颜色分量)提取方法,同时分析了各种特征向量之间的不相似测度的计算方法。比较了全局阈值、滑动窗口法、聚类法等各种门限的选择方法,将MPEG-7中的推荐使用的颜色布局描述子应用到镜头检测和关键帧提取中,经过对一些视频的测试,对突变检测效果很不错。在渐变过程中,分析了基于twin-comparison和基于高原效应的检测方法,分析了渐变产生的模型。本文将渐变的模型条件放宽,并在此基础上提出了基于一致性测度的三帧检测法。在关键帧提取上,将颜色布局描述子和无监督聚类结合,产生了不错的效果。实验表明,将颜色布局描述子作为视觉特征用于关键帧提取,十分有效,不但取的关键帧很有代表性,而且有较高的压缩比。