基于内容的新闻视频检索关键技术研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:dvrgbedr544y4d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据通信技术、音视频压缩技术和计算机软硬件技术的迅猛发展,使得海量视频信息的传输和存储成为可能,视频信息摆脱以往的限制,在人们现实生活和工作中发挥越来越重要的作用。为了实现视频信息的有效组织、分析、管理和检索,基于内容的视频检索系统(CBVR)应运而生,并逐渐成为信息科学领域的重点课题。新闻视频涉及内容广泛、受关注度高,而且新闻视频自身具有特殊的结构和组织特征,这都使得针对新闻视频的处理成为目前CBVR研究的热点。本课题以此为背景,对基于内容的视频处理与检索技术进行了研究。论文对CBVR中的基本概念、系统结构和关键技术进行了介绍,分析视频处理过程中的镜头检测、关键帧提取和镜头类聚方法,采取了直方图信息、信息熵和聚类算法相结合的思想,提出了改进的方法,通过实验对改进算法进行了进一步的验证,最后利用软件编程,对部分关键技术内容进行了软件实现。论文的主要研究内容如下:(1)为了实现视频内容有效分析和检索,本文对视频的镜头检测技术进行了研究,结合新闻视频在特征和镜头变换上的特点,在原有算法优点的基础上引入信息熵的知识,实现了基于HSV模型的直方图求交互信息量镜头检测算法,实验验证表明该方法对视频镜头检测性能有了较大的改善。(2)本文对关键帧提取技术进行了研究,结合之前镜头检测中对信息熵与直方信息融合技术的学习,采用了基于视频帧间交互信息量和聚类算法的提取方法,通过对新闻视频内容的提取处理,实现了镜头内容的全面表达。(3)针对镜头聚类中的K均值算法易陷入局部最优解的缺点,采用模拟退火算法对K均值的聚类进行改进,提高K均值算法的全局寻优能力,从整体上改善镜头聚类的效果,实验验证表明该算法对视频镜头聚类性能有了较大的改善。
其他文献
随着移动互联网的发展和智能手机等移动终端的普及,二维码技术在博物馆图书馆的应用也越来越多。论文在对国内外博物馆展品信息管理系统的调研基础上,结合(中华航天博物馆)展品的
目前,我国矿山开采深度、强度和规模逐年增加,采矿条件愈加恶劣,急需先进的采矿设备和技术来改善现状。井下自主行走机车是采矿设备智能化研究的一大趋势,自主导航系统研究是
随着计算机和网络技术的飞速发展,电子邮件已成为互联网应用最广泛的服务,电子邮件的安全问题也成为互联网应用的一项关键性技术问题。当前电子邮件系统面临的主要威胁有信息
车牌汉字识别是目前我国车牌识别的难点和关键所在。论文通过对目前汉字识别方法的学习和研究,结合我国车牌的特点,基于支持向量机实现两种车牌汉字识别方案:第一个方案首先
图像修补(image inpainting)不是要减低或去除图像受到的干扰(如,噪声、模糊等),而是要填充/移除图像局部的特定对象(如文字,物体等)。本文对基于马尔可夫随机场(MRF)模型的
步态作为一种生物特征,在身份识别领域中占有很重要的地位。个体的步态与指纹、脸相、虹膜等相比,具有难以模仿、可远距离观察等特点,且在数据采集时不完全依赖测试者的主动
移动互联网是近年来最热门的技术领域之一,越来越多的人通过智能终端接入移动互联网享受移动应用带来的便捷,基于位置的服务(LBS)是其中非常重要的一类。用户通过使用LBS应用