论文部分内容阅读
随着多媒体设备的普及和网络技术的发展,数字视频资源逐渐成为数字图书馆中重要的数字资源。视频作为一种音像结合、图文并茂的信息传播形式,可以最大限度地记录事件发生的真实场景,与文字相比具有更强的描述能力,对事物的描述更加真切,能够更好的满足用户的信息需求,受到大众的广泛青睐。面对海量的视频资源,如何使用户快速准确的查找到所需的视频信息已经成为数字图书馆急需解决的问题。传统的基于关键词的检索方法已经无法满足用户的信息需求,为了弥补基于关键词检索方法的不足,基于内容的视频检索方法被提出。这一检索方式直接对视频内容进行检索,可以有效提高检索的准确率。因此,本文针对数字图书馆中的视频检索问题进行了研究,构建了数字图书馆基于内容的视频检索框架,结合Contourlet变换理论,提出了基于Contourlet变换的视频检索方法,以期为数字图书馆的视频资源检索研究提供有价值的参考。本研究将数字图书馆视频资源建设、视频检索研究可视化、视频检索框架和基于Contourlet变换的视频检索方法作为研究内容,采用文献分析法、文献计量法、实验仿真法、对比分析法和多尺度变换法进行本文的研究。通过文献调查发现国内数字图书馆视频资源建设主要有三种方式:自建、外购和共建共享,其中外购是主要方式,自建主要是针对地方特色资源,并且在视频资源建设中呈现大众化和外包化的趋势。通过运用CiteSpace软件对Web of Science上的5422条文献记录进行文献计量分析,分析了视频检索研究的时间分布、各国实力、核心机构、核心作者和关键作者、知识基础、研究热点与前沿。分析发现视频检索研究还处于成长期;其主要研究力量分布在美国和中国,而印度具有较大的发展潜力;在近期的研究中重要作者有David G.Lowe、Josef Sivic、Cees G.M.Snoek和张智威;视频检索研究的知识基础最早可以追溯到1945年Bush发表的As We May Think一文;目前最新的研究热点在于三维目标检索、大数据和深度学习;研究前沿主要在于视频内容分析及方法、视频检索的应用和视频检索系统搭建及优化三个方面。通过结合典型的数字图书馆视频检索框架构建出基于Contourlet变换的视频检索框架,该框架采用C/S架构,可以分为三个部分:视频资源管理系统、视频分析系统和用户交互界面。本文主要针对视频分析系统进行详细设计,视频分析系统包括关键帧提取、特征提取和相似度匹配等过程。关键帧提取采用固定帧的方法,每隔10帧提取1帧作为关键帧。特征提取采用Contourlet变换对关键帧进行三层分解,计算分解后的高频信息的均值和方差,生成关键帧的特征向量,并构建视频指纹。相似度匹配采用空间向量的方法利用欧式距离度量视频的相似度。最后对构建的视频检索框架进行了仿真实验验证,在VCDB数据库中选取10个视频文件,对选取的视频进行10种攻击,生成100个视频文件作为实验数据。并以准确率、召回率和F1值三个指标作为检索结果的评价准则。算法程序在Matlab2013a上实现,同时设置基于小波变换的检索方案作为对比实验,实验结果显示基于Contourlet变换的视频检索方案要优于基于小波变换的视频检索方案,对各种攻击具有较好的鲁棒性。通过在所构建的视频库上的实验表明,本文所构建的基于Contourlet变换的视频检索系统对于数字图书馆中的视频检索是一种可行和有效的办法。利用该系统可以实现视频内容的检索,有助于数字图书馆提高视频检索服务水平,有效弥补基于关键词检索的不足。