论文部分内容阅读
数据通信技术、音视频压缩技术和计算机软硬件技术的迅猛发展,使得海量视频信息的传输和存储成为可能,视频信息摆脱以往的限制,在人们现实生活和工作中发挥越来越重要的作用。为了实现视频信息的有效组织、分析、管理和检索,基于内容的视频检索系统(CBVR)应运而生,并逐渐成为信息科学领域的重点课题。新闻视频涉及内容广泛、受关注度高,而且新闻视频自身具有特殊的结构和组织特征,这都使得针对新闻视频的处理成为目前CBVR研究的热点。本课题以此为背景,对基于内容的视频处理与检索技术进行了研究。论文对CBVR中的基本概念、系统结构和关键技术进行了介绍,分析视频处理过程中的镜头检测、关键帧提取和镜头类聚方法,采取了直方图信息、信息熵和聚类算法相结合的思想,提出了改进的方法,通过实验对改进算法进行了进一步的验证,最后利用软件编程,对部分关键技术内容进行了软件实现。论文的主要研究内容如下:(1)为了实现视频内容有效分析和检索,本文对视频的镜头检测技术进行了研究,结合新闻视频在特征和镜头变换上的特点,在原有算法优点的基础上引入信息熵的知识,实现了基于HSV模型的直方图求交互信息量镜头检测算法,实验验证表明该方法对视频镜头检测性能有了较大的改善。(2)本文对关键帧提取技术进行了研究,结合之前镜头检测中对信息熵与直方信息融合技术的学习,采用了基于视频帧间交互信息量和聚类算法的提取方法,通过对新闻视频内容的提取处理,实现了镜头内容的全面表达。(3)针对镜头聚类中的K均值算法易陷入局部最优解的缺点,采用模拟退火算法对K均值的聚类进行改进,提高K均值算法的全局寻优能力,从整体上改善镜头聚类的效果,实验验证表明该算法对视频镜头聚类性能有了较大的改善。