基于内容的视频情感提取算法研究

来源 :山东建筑大学 | 被引量 : 0次 | 上传用户:a1263951733
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信技术、宽带网络技术、音视频压缩技术以及计算机技术的发展,数字视频也越来越广泛地融入于人们的生活空间中。多媒体人机交互界面(HCI)中的图像/视频不仅携带了大量的图像信息,还携带了大量的情感信息。如何在图像/视频检索系统中引进情感计算技术,使计算机能够识别图像/视频中的情感信息,并利用这些情感信息进行视频的检索,已成为目前人们倍加关注的课题。本文主要针对故事片这类视频,根据其拍摄的风格和特点,对其情感提取算法进行了研究,分别从音频和视频两方面提取出某些片段的情感特征,并根据这些情感特征对该视频段进行情感分类。主要内容如下:在音频方面,本文提出了运用比例因子等特征利用支持向量机进行音频情感分类方法,通过提取MPEG音频流比例因子等特征,首先把音频分为语音、音乐、混音和静音四类,然后对语音、音乐、混音的音频段进行情感分类,将音频包含的情感分为:高兴、悲伤、生气、厌恶、惊奇和平静六类,并通过实验证明了该方法的可靠性和有效性。为从视频图像中提取情感信息,首先要对视频进行镜头分割,并提取镜头的关键帧。本文提出了一个基于支持向量机核函数重构的镜头边界检测算法。该算法利用视频压缩、域中特征,如宏块类型,帧间对应宏块DC系数差和帧类型将视频帧分为发生切变的帧、发生渐变的帧和非镜头变换帧三类,实现视频的镜头分割。与常用的核函数进行了比较实验,结果显示当构造的核函数为径向基函数与高斯核函数叠加时镜头边界检测的准确率最高,其综合性能指标SUM_F1比2001 TREC评估中获得SUM_F1最佳指标的算法高约14%。根据故事片的特点,还提出了一种抽取镜头关键帧的方法。在镜头分割和提取关键帧后,利用支持向量机对故事片的关键帧进行情感的识别和分类,采用的特征是彩色直方图和MPEG-7的边缘直方图。用径向基函数构成SVM,进行训练和测试,分类后得到视频关键帧粗略的情感语义。
其他文献
人脸检测与识别技术在模式识别和机器视觉领域中,是最有挑战性的研究课题之一。由于人脸信息比其他的生物特征信息更具有优势,所以它有着广泛的应用前景。其中,安全认证、视频监
随着饮料、化妆品、医药、农药等行业的飞速发展,国内外对PET(化学名为聚对苯二甲酸乙二醇酯)瓶的需求量越来越大。然而目前国内生产PET瓶的吹塑设备基本是进口产品的天下,特
伴随着现代高新科学技术的蓬勃发展和军事政治需求的不断增大,运用多智能体路径规划算法开展多无人机编队航路规划研究,已成为近年来的研究热点之一。目前,为提高现代战场适
数控机床一般由数字控制系统、伺服驱动系统和反馈检测系统等三部分组成。作为高档机床的“大脑”,先进的数控系统技术是制造业实现自动化、集成化、网络化、数字化的关键,它
人类视觉功能有诸多限制(缺陷),如空间分辨率限制,时间分辨率限制,颜色分辨率限制,对比度分辨率限制。补偿(改善)和利用这些限制,产生了一些相关的科学和产业。为补偿人类视觉空间
电力电子技术的飞速发展,一方面给电能的变换和应用带来了方便,另一方面对电力系统安全、稳定、经济运行带来了极大的威胁。电力电子装置所引起的谐波和无功电流对电力系统的
学位
一个完整的网络端到端通信包括无线接入网和有线核心网两部分。当前,随着因特网及互联网应用的迅速发展,网络拥塞和资源分配问题日益严重。这些问题是不可避免的,因为TCP和UD
流量计量是流量控制的基础,差压式流量计是工业生产中应用广泛的一种流量计,V锥流量计出现为差压式流量计的发展打开了一个新的领域。但是V锥流量计由于其本身结构的原因还存
作为一种具有远距离,全天候,全天时成像能力的主动式探测系统,合成孔径雷达(SAR)被广泛应用于军事及民用的各个邻域。随着成像技术的不断发展及空间分辨率的不断提升,对SAR图像的成