论文部分内容阅读
随着信息技术,计算机网络技术的快速发展,以及多媒体技术的广泛应用,视频信息大量涌现,如何从如此丰富的信息中快速、准确的检索出所需要的信息就显得至关重要。在这个形势下,基于内容的视频检索技术(content-based video retrieval CBVR)迅速发展起来[1]。镜头分割和关键帧提取是基于视频检索的的关键技术,镜头分割影响着检索的最终效率,而关键帧的使用很大程度上减少了视频检索的数据量。本文针对镜头分割和关键帧提取的准确度展开了研究和改进。本文主要研究了信息论在基于内容的视频检索技术的应用,并提出了几点改进,具体如下:(1)本文研究了基于内容的视频检索的国内外研究状况、视频结构及其特点,明确了研究目的。(2)本文对镜头边界检测算法进行了深入研究。镜头分割是进行视频处理的第一步,对基于内容的视频检索有至关重要的作用,本文分析了常用的经典的镜头分割方法,重点研究了基于互信息量的镜头分割方法[1]。在分析了现有的几种基于互信息量的镜头边界检测算法的基础上,针对闪光和噪声的影响,提出了一种灰度共生矩阵和互信息量相结合的镜头边界检测算法。最后,针对作者建立数据库中不同类型的视频运用现有及本文提出的方法进行镜头边界检测比较,实验结果表明本文算法在查全率与查准率上均取得了改进。(3)关键帧提取在视频检索中至关重要,直接影响检索效率。本文在简要分析目前常用的关键帧提取算法基础上并作出了改进:一是结合镜头边界和镜头内容的方法对原有的方法进行改进;二是结合镜头边界时采用的互信息思想,对一种基于互信息量的关键帧提取算法进行改进。实验结果表明,使用本文提取关键帧的算法更简单,容易理解,可以较准确的反映镜头的内容。(4)在对镜头边界检测和关键帧提取算法改进的基础上,本文讨论了视频间相似性度量的问题,并通过实例对关键帧的视频检索进行研究并分析。最后,对基于内容的视频检索系统模型进行了研究及展望。