基于多模态特征的视频语义镜头标注

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：ghmyjp

【摘要】

：

视频的镜头类型是视频底层特征和高级语义之间的桥梁，能有效弥补两者之间的鸿沟，有助于视频精彩事件检测，促进创建视频摘要，进而满足用户快速查询和浏览视频的要求。现有视频语义

【作者】

：

董琳娜

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2013年期

【关键词】

：

多模态特征镜头特征矢量语义镜头标注文本/视频时间对准

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频的镜头类型是视频底层特征和高级语义之间的桥梁，能有效弥补两者之间的鸿沟，有助于视频精彩事件检测，促进创建视频摘要，进而满足用户快速查询和浏览视频的要求。现有视频语义镜头标注方法大多基于视频的视觉特征，未充分利用多模态特征，浪费了数据资源，标注效果也有待提升。本文提出了基于多模态特征的视频语义镜头标注方法，并应用于足球视频，主要工作有：（1）分析并提取了足球视频的多模态特征。包括镜头关键帧的视觉特征—草色块个数、人脸区域参数、边缘、纹理和镜头的摄像机运动特征；镜头对应音频信号的平均短时能量、短时过零率、音频帧能量序列的自相关函数特征。同时，本文提出了累积方差法，并结合连通域分析技术提取了足球视频记分牌中的时钟数字，采用支持向量机(Support Vector Machine, SVM)对提取出的时钟数字进行了识别，用关键词匹配方法提取了足球视频网络直播文本的文本事件及对应的时间标签，并将文本/视频的时间进行了对准。实验结果证明了特征提取方法的正确性。（2）分别将提取出的一部分视频镜头的视觉特征矢量集和多模态特征矢量集作为训练数据，输入分类器，采用决策树C4.5挖掘特征矢量和镜头类型之间的潜在关系，即建立语义镜头标注的模型，并用该模型对新的足球视频镜头集进行了语义标注。实验结果证明，本文基于多模态特征的视频语义镜头标注方法比基于视觉特征的标注方法性能好。最后总结了本文的研究内容，展望了未来的研究方向。

其他文献

基于LVDS的高速远程传输系统的设计

LVDS的全称是Low-Voltage Differential Signaling，即低电压差分信号，是20世纪末美国国家半导体公司提出的一种信号传输模式，是一种电平标准。LVDS接口技术可作为一种高性能数据

学位

低电压差分信号高速远程传输系统电路设计数据传输信号处理

嵌入式磨削加工表面质量图像检测系统关键技术研究

嵌入式系统是一种高度集成化，针对应用而设计的专用计算机系统，嵌入式系统是一种具有特定功能的计算机系统，它与通信技术和网络技术的结合，极大的增强了设备的网络和通信的灵活性

学位

图像处理ARMOpenCVLinuxCanny算法

WVSN中可视化防护带覆盖算法的研究

无线可视化传感器网络(Wireless Visual Sensor Networks, WVSNs)是由许多分散在目标区域中的图像拍摄系统节点所构成。相对于传统的无线传感器网络(Wireless Sensor Network

学位

无线可视化传感器网络防护带覆盖算法集中式分布式传感器感知模型

水下声靶接收处理系统设计

本文研究的是水下声靶接收处理系统设计。声靶主要分为信号接收、信号处理、回波发送三个主要部分，本文研究的重点是信号接收和信号处理。为了达到较好的实时性，采用了NI公司开

学位

水下声靶接收处理系统希尔伯特变换信号检测FPGA技术

基于GPU的阵列雷达信号处理技术研究

随着雷达信号处理算法的研究不断深入,信号处理系统的复杂性与实效性的矛盾更加突出,提高雷达信号处理速度成为必要。近年来,GPU(Graphics Processing Unit,图形处理器)技术

学位

阵列雷达信号处理系统实现GPU

基于无线Mesh的无线体域网关键问题研究

无线体域网作为无线传感器网络的一个重要分支，是一种新的交叉学科。其整合了许多高新技术，如分布式信息计算与处理技术、传感器技术、嵌入式技术、无线网络和通信技术等，被广泛

学位

无线体域网无线Mesh网络伙伴系统地址分配移动管理

基于达芬奇平台的夜间车辆检测系统的设计与实现

本文研究并实现了基于达芬奇平台的夜间车辆检测系统。该系统在嵌入式平台上实时分析交通视频信号，准确计算出车流量、车速等交通参数，并能有效抵抗车灯直射摄像头产生的光晕、

学位

夜间车辆检测车灯识别嵌入式技术达芬奇平台系统设计

基于ARM的GPS/SINS组合导航系统研究

全球定位系统(GPS)和捷联惯性导航系统(SINS)具有很强的互补性,本文主要研究了基于ARM的SINS和GPS的组合导航系统。本文首先对GPS和SINS进行了概述,分别介绍了两个子导航系统

学位

ARMGPSSINS卡尔曼滤波组合导航

LTE FemtoceⅡ上行链路检测与干扰抵消技术研究

Femtocell又称毫微微小区，或家庭基站，是一种小型低功率基站，覆盖范围为10-50m，主要用于解决室内覆盖问题，具有接入简单、低功耗、低成本等特点。在家庭基站和宏基站的频率资源分

学位

家庭基站上行链路检测算法干扰抵消技术用户配对

无线广播网络的网络编码研究

网络编码自提出以来,已在理论上证明可以带来诸多好处,如大幅增加网络的容量,使分布式系统的设计更为简化。然而,目前实际系统中却很少采用网络编码技术,主要存在的问题有：引

学位

网络编码无线单跳广播无线协作广播反馈机制反馈开销解码时延可靠性解码复杂度

基于多模态特征的视频语义镜头标注

其他学术论文