【摘 要】
:
随着计算机、通信和多媒体技术的不断发展,视频信息快速增长,如何从海量视频数据中快速有效地检索出所需要的信息,成为视频相关领域里的研究热点。由于视频数据的无结构化特
论文部分内容阅读
随着计算机、通信和多媒体技术的不断发展,视频信息快速增长,如何从海量视频数据中快速有效地检索出所需要的信息,成为视频相关领域里的研究热点。由于视频数据的无结构化特点,视频检索必须以视频分割为基础。所以,视频分割技术具有重要的研究意义和应用价值。
视频分割的过程就是将无结构化数据分割为“帧--镜头--场景--视频节目”的层次结构的过程。由于存在语义鸿沟,对视频进行语义分割是比较困难的。本文对“帧--镜头”(镜头检测)和“镜头--场景”(场景构造)两个层次进行了深入研究,分别对这两步进行了改进,主要工作如下:
首先,针对已有镜头检测方法中阈值判定自适应性差的问题,对一种基于滑动窗口的镜头边界检测方法作了改进。在利用HSV(Hue,Saturation,Value)直方图计算出帧间不连续值的基础上,缩小滑动窗口内选取样本的比较粒度,利用高斯模型生成自适应阈值,同时检测出镜头渐变和切变。
其次,针对视频分割中存在的语义鸿沟问题,采用语义矢量来建立低层特征和高层语义之间的关联。根据镜头关键帧画面语义的不同,提取镜头关键帧的颜色特征,并将其归一化;然后利用支持向量机对归一化后的特征量进行语义分类预测,从而生成语义矢量;将生成的语义矢量应用于已有的重叠镜头链方法,对镜头关键帧进行聚类,按语义差别构造出不同场景。
最后,选取不同风格的非压缩域视频序列进行实验。结果表明,改进后的镜头边界检测方法可以准确快速地定位镜头边界,查准率较以往方法有一定提高;语义场景构造能够取得较为满意的效果。
其他文献
随着虚拟现实技术和仿真技术的兴起,快速、健壮的碰撞检测检测算法在虚拟现实、计算机游戏、计算机辅助设计等领域扮演着重要角色。在刚体对象的碰撞处理中,由于模型不会发生
图像分类是计算机视觉和人工智能领域最近几年的研究热点。支持向量机是基于结构风险最小化原理的高效分类器,其核心技术之一是核函数。塔形匹配核(Pyramid Matching Kernel,PMK
数字水印是一种信息隐藏技术,通过将具有确定性和保密性的信息(水印)直接嵌入到数字化媒体中,使之作为原始数据的一部分保留在其中,即使在解密之后仍可以对数据的复制和传输
词聚类就是对一些纷繁的个别词应用某种方法进行分组形成语义相近或相关的词类(或词聚簇)。它在智能检索、文本分类、词义排歧、机器翻译等领域都有广泛的应用,是语言学和自
随着数码技术的快速发展和数码相机的广泛使用,用户将不断收集大量的个人数码相片,如何帮助用户组织和管理这些相片是一个重要的问题。聚类技术是解决这个问题的主要方法之一,传
这数十年以来移动Ad Hoc网络的迅速发展,它的应用已经从以前的仅仅应用在军事事业上扩展到了与我们息息相关的生活应用中,比如在我们周围的无线局域网,还有目前较流行的传感
数字信息的不断增加迫切需要产生一个高效的信息检索系统。从某种意义上说,不易被检索到的信息如同丢失的信息一样。信息以不同的格式和样式显示,因此需要有不同的检索机制与之
湍流问题曾被称为“经典物理学最后的疑团”,是流体力学中尚未解决的最复杂的理论之一。湍流是一种在任一空间点的瞬时物理量都在作剧烈变化的随机运动,在湍流中存在无序的小尺
近年来,军队网络信息化建设快速发展,军队无纸化办公已基本成形。随着机关电子文档的急剧增加以及涉密公文的增多,对这些公文的管理已成为急待解决的问题。由于现有的全文检
随着计算机技术和通信技术的迅速发展,传统的工作方式也发生着改变,远程办公正受到人们的普遍关注。远程办公为企业的发展创建了广阔自由的环境,提供了丰富的资源,拓延了办公时空