论文部分内容阅读
随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增多。视频作为多媒体信息中最复杂的一种媒体形式,凭借其多样化的表现形式、丰富的语义内容,以及快捷的记录方式得到了广泛的应用和发展。与此同时,大量存储技术的发展,使得数字化视频信息存储的代价越来越低,进而促进了数字视频信息的大量产生和堆积。面对越来越多的海量视频数据,如何快速有效地进行视频分析和检索是当前视频信息研究领域的当务之急。 视频结构化分析是基于内容的视频分析的一项重要内容,是各种视频分析与应用的前提。本文主要对视频结构化分析中的结构化分割、视频库的结构化组织、结构特征的提取与应用等进行了深入系统地研究,提出了一些相关的有效算法,并用实验验证了这些算法的有效性。 聚类方法是视频结构化分析中常用的方法。集成学习技术可以提高学习器的范化能力。根据聚类的特点,本文提出了基于双向Boosting的模糊聚类集成算法,双向聚类集成算法在迭代中生成的训练样本不仅包含难聚类样本,同时也包含了易聚类样本。实验表明双向聚类集成算法具有良好的稳定性和准确性。 视频作为一种非结构化数据,结构化分割是基于内容的视频分析的首要工作。本文对视频物理单元的分割提出了基于统计信息的视频镜头分割和关键帧提取算法。任何类型的镜头转化都会引起非一致的帧差变化,利用帧差统计信息,引进调谐参数,实现各种类型的镜头边界的准确检测;镜头分割过程的帧差统计信息同时也用于随视频内容变化的关键帧提取。实验验证了算法的合理和有效性。 视频摘要可以提供视频的精简表示。论文针对视频摘要的两种形式提出了基于流形学习和混合模型的自动视频摘要方法,该方法可以自动的产生不仅包含视频主要内容同时冗余信息少的摘要结果。同时提出了镜头组生成算法,该方法使用双向Boosting聚类集成算法,可以得到准确的镜头组结果。 视频检索是视频结构化分析的一种应用。视频库的合理组织和管理有利于视频检索的实现。视频库的索引是此类问题研究的热点。本文提出了基于双向Boosting的聚类集成索引算法。基于双向Boosting聚类集成的视频库索引算法不仅可以产生高效的视频索引,而且可以稳定的产生高效索引,降低弱范化算法产生不良索引结构导致系统低效的风险。 时序结构特征是视频区分于图像的重要特征。如何提取、表示视频不同层次的结构特征是视频分析的难点。本文提出了不同层次的视频结构特征提取和表示方法,并应用于视频的检索。对于视频的物理单元——镜头,提出首先使用动态规整算法提取镜头特征帧,然后生成镜头关联图,使用关联图的谱特征作为镜头的结构特征。视频片段的编辑操作不仅会引起视频内容的变化也会引起视频片段结构的变化。时序加权关系图不仅描述了片段镜头间的内容关系,也可以描述时序关系。本文还提出用视频片段的时序加权关系图的拉普拉斯谱距离衡量片段的时序结构距离,理论分析了部分视频编辑操作与谱距离的关系。