【摘 要】
:
随着人类科学和信息技术的发展,计算机与人类的生活越来越紧密,新型人机交互技术逐渐成为研究热点,语音情感识别作为一种提高计算机智能化、人性化水平的新技术具有重要研究价值
论文部分内容阅读
随着人类科学和信息技术的发展,计算机与人类的生活越来越紧密,新型人机交互技术逐渐成为研究热点,语音情感识别作为一种提高计算机智能化、人性化水平的新技术具有重要研究价值和应用前景。情感特征的提取是语音情感识别的重要方面。针对目前大多数的语音情感特征不能有效体现语音情感特性,情感识别率不高的问题,本文从信号分析方法入手,将Hilbert-Huang变换引入语音信号处理,先对Hilbert-Huang变换中存在的一些问题进行了改进,然后基于Hilbert边际能量谱提取了一组新的情感特征用于语音情感识别。具体内容如下:(1)本文首先对常用的传统声学特征进行了提取,分析了高兴、愤怒、悲伤、平静、厌倦五种情感状态下,语音信号的韵律特征(基频、短时能量、过零率)及频谱特征(MEL频率倒谱系数、线性预测倒谱系数)的情感特性。(2)将Hilbert-Huang变换用于语音信号的处理,首先,对Hilbert-Huang变换中主要影响信号频谱分析的缺点进行了改进,对于影响频谱分析的模态混叠问题,引入总体平均经验模态分解(EEMD)方法进行改进,而对于固有模态函数中伪分量的剔除问题,使用了一种基于能量分析的新方法;然后,通过对不同情感语音的Hilbert边际能量谱的比较分析,提取了一组新的情感特征:Mel频率边际能量系数(MFEC)、Mel频率子带频谱质心(MSSC)、Mel频率子带频谱平坦度(MSSF),总称为Hilbert边际能量谱特征。(3)本文采用支持向量机(Support Vector Machine,简称SVM)对语音情感进行识别,首先通过对比实验验证了Hilbert边际能量谱特征的有效性,然后将基于频域的全局Hilbert边际能量谱特征与局部短时韵律特征做了融合识别,实验结果表明,将HHT用于情感语音的处理提取的特征具有较好的识别效果,将全局Hilbert边际能量谱特征与局部短时韵律特征相融合,有助于情感识别率的进一步提高。
其他文献
随着互联网技术和无线通信网络技术的迅猛发展,人们对各种无线通信业务的需求越来越丰富,通信系统在提升这些性能的同时要降低系统能量损耗,使能符合绿色通信的理念。系统的
近年来因波前为涡旋形状而具备轨道角动量(OAM)的电磁波所展现的信息携带能力越来越受关注。作为电磁场的基本物理量,OAM在物理层提供了信息调制的额外自由度,利用不同OAM模
软件定义网络(Software-Defined Networking)是一种新型的网络架构,通过控制面和数据面分离、集中式的管理和可编程的接口实现对网络的灵活控制。将SDN和无线网络结合受到越
语音转换是在保持语义不变的前提下,着重改变源语音中的个性特征成分,使得转换后的语音具有目标说话人的个性特征。本文主要研究语音转换中的声道谱参数和基音频率两个重要个性
压缩感知是针对稀疏或可压缩信号,在信号采样的同时并进行适当压缩的新理论,其采样速率远低于奈奎斯特采样速率。测量矩阵在信号采集和信号重建环节中发挥着至关重要的作用,
水声探测的核心问题之一是目标声源的被动定位问题。被动定位问题本质是逆问题推断,通过对传感器阵接收的含有噪声的目标辐射声信号在空间和时间上采样、分析,结合传播模型和先验知识等正向知识,推断目标所在的空间位置。目标辐射声信号是在一个上下有界,左右无界的三维波导内传播,是三维声场,目标位置具有三维属性。通常使用的水平线阵或垂直线阵都只是在一维声场上进行采样,没有对三维波导进行充分的空间采样,因而不具备对
近年来,数字化医院的建立对PACS (picture archiving and communication system)系统的需求不断增加。而数字化影像设备的广泛应用使医学数据呈爆炸式增长,给PACS系统中有限
无线射频识别(Radio Frequency Identification,RFID)技术,是一种利用射频无线通信实现的非接触自动识别技术。伴随着物联网技术的发展,符合ISO/IEC18000-6C协议的超高频(UHF
颅内出血(ICH)是最严重的急性脑血管疾病之一,也是急性神经紊乱疾病,如偏瘫等的重要发病诱因。对于临床治疗来说,颅内出血的分割具有重要意义。因此,如何应用CT图像诊断颅内