基于内容的重排列视频检索技术研究

被引量 : 12次 | 上传用户:uan998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和计算机技术的迅速发展,网络中的视频信息正在爆炸式的增长。为了满足用户快速获得期望信息的需求,基于Web的搜索引擎开始蓬勃发展。而主流的搜索引擎发展略显滞后,停留在文本搜索的阶段。显然,对于一段信息量非常丰富的视频来说,简单的文本标注无法准确的描述视频内容,这使得基于内容的视频检索技术的研究成为一个紧迫的任务。因此,许多研究者已经开始研究如何有效的利用视频中的图像和语音等信息,提高检索精度。本文主要从视频检索的基本流程入手,将视频检索分为视频分析和视频检索框架两个部分。视频分析主要是视频结构化的处理和信息的提取,将重点研究镜头分割和基于关键帧的镜头描述。在视频检索框架部分,主要是研究如何利用基于重排列的分类算法提高检索结果的相关度,并建立完整的视频检索框架。视频从结构上可以划分为场景、镜头和图像帧。在视频检索中,由于镜头是视频处理的最小单元,首要任务就是将视频片断分割为镜头单元。本文分析了现有镜头分割算法准确率和速度无法获得较好平衡的缺陷,提出了一种快速的由粗到精的镜头分割算法,能够有效地判别相机(物体)运动和镜头渐变之间的区别。首先,基于本文提出的改进的信息熵,比较连续帧之间的差别,利用自适应阈值判断出一组候选的镜头。然后使用本文提出的快速运动边缘检测算法,在候选镜头中将相机(物体)运动检测出来。由于提出的算法基于特征的统计特性,可以大大减少计算量。在镜头描述阶段,分为动态和静态描述两个部分。动态描述是通过分析镜头内连续帧之间的运动变化,获得了镜头的运动量化特性,作为本文中镜头的辅助描述方法。静态描述方法则采用了基于关键帧的特征描述方法,提出基于颜色不变区域和局部特征相结合的视觉单词描述算法。在静态描述阶段,首先分析了现有基于灰度图像的局部特征描述符缺乏对颜色信息的描述。然后从彩色图像入手,提出了改进的准不变量提取方法,进一步获得了稳定的颜色不变区域,在此基础上颜色不变区域的描述符被提取。最终,利用提出的颜色不变区域和现有的局部特征相结合形成视觉单词(Bag of Visual Words, BOW)模型,并和类似的视觉单词模型在图像库进行了检索比较,由于稳定的颜色线索被引入,我们的方法性能有了显著的提高。在视频检索框架的构建部分,提出了基于主类别的重排列算法,并结合视频结构化和视觉单词描述方法构建了基于重排列的视频检索框架。在检索过程中,首先利用传统基于文本的Web搜索引擎获得初始查询结果,使用聚类方法,将顶层返回结果区分无关和相关样本。在获得了样本的类别后,分析了样本特征空间的分布特性,提出了基于主类别的线性判别模型。在最后的实验中,本文提出的视频结构化方法、镜头描述及重排列方法最终构成了基于重排列的检索框架,完成了检索任务,提高了检索精度。
其他文献
中长链二元酸是重要的精细化工中间体,目前,国内中长链二元酸的产量严重不足。本文使用臭氧作氧化剂,克服传统氧化方法制备中长链二元酸中存在的成本高、工艺复杂、环境污染
随着工业的发展,环境污染己经成为人们面临的一个全球性的严峻挑战。在处理污染有机物的方法中,光催化氧化技术因其具有简单易行、经济实用、无二次污染等特点,已经引起了研
对汽轮机叶片锻模的结构特点进行了分析,并对失效后的锻模进行了蓝光扫描试验、宏观观察断口、扫描电镜、能谱分析、硬度检测等分析与研究,找出锻模失效的主要形式和根本原因
不同于以往IPO承销商选择的研究视角,文章基于新制度理论和组织学习理论,研究了组织间模仿对IPO承销商选择行为的影响。以2006—2012年我国中小板IPO事件为研究对象,发现模仿是
介绍二种适用于低音扬声器的两种不同充磁方向磁体联合应用扬声器磁路.讨论了联合应用磁路所用钕铁硼磁体的压制成型、磁性能检验、装配和充磁.
狮子自汉朝传入中国,作为百兽之王成为民间保护神,融入闽台文化后,衍生出了避邪吉祥物——风狮爷,成为闽台神圣而不可逾越、根深蒂固的民间信仰,是闽台人民共同创造的精神财
约翰·塞巴斯蒂安·巴赫(Johann Sebastian Bach)(1685-1750)是西方巴罗克音乐文化阶段最伟大的音乐家之一。作为德国作曲家、管风琴大师与古钢琴演奏家的巴赫,研究学者
1 变形分析 160105外圈车工图.加工简图,车刀架先快速纵向进给,然后快速横向进给,再横向工作进给进行切削加工.机床型号为C872A;主轴转速为240 r/min,进给量为0.2 mm/r;采
研究目的:采用客观的体力活动测量方法,用三年时间纵向调查南京市建邺区小学生体力活动状况,分析和纵向比较学习日和周末小学生体力活动的特点以及其与身体形态的关系,同时分析造