基于多级分类的语音情感识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:llsnow_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能飞速发展的今天,机器若要真正实现智能化,则必须要能够理解人类的情感,所以对于人类语音情感识别的研究显得尤为重要。本文选用柏林语音情感库,在传统SVM用于语音情感识别的基础之上,提出了一种多级分类算法,平均识别率较传统SVM方法提高了5.42%;然后本文又利用PCA来进行特征优选,将优选后的特征用于语音情感识别实验,所得七种情感的平均识别率也较传统SVM方法提高了5.24%;最后本文将多级分类与PCA相结合,在每一级判决器上都采用PCA来进行特征优选,最终得到七种情感的平均识别率较传统SVM方法提高了7.85%。本文研究了如何对语音文本进行端点检测,并研究了MFCC、基音频率、共振峰、Delta特征、短时过零率、短时能量等情感特征的提取方法。采用所提取到的情感特征并利用传统SVM方法进行语音情感识别获得了58.69%的平均识别率。由传统方法所得出的混淆矩阵,本文引入了混淆度的概念,从而提出了一种多级分类构造算法,即将容易区分的情感先分开,然后再对易混淆的情感进行分类,逐级地判断出待识别语音的情感类型。与传统SVM进行语音情感识别相比,基于多级分类的语音情感识别平均识别率提高了5.42%,从而证明了该多级分类算法确实能够提高语音情感的识别率。然而,由于所涉及语音特征较多,算法对运行速度和存储空间都有较高的要求。本文采用PCA来优选特征,将PCA与传统SVM方法相结合得到的平均识别率较传统基于SVM方法提升了5.24%,从而证明了PCA用于特征降维并优选特征确实能够提高情感识别率。最终将多级分类与PCA特征降维相结合,从而得到七种情感的平均识别率为66.54%,与传统基于SVM方法进行语音情感识别进行对比,该方法得到的平均识别率提高了7.85%,从而证明了本文所提出的方法的正确性。
其他文献
卫星通信技术作为当今世上最先进的通信技术之一,其覆盖面积大、通信距离远等优点使其在各个领域发挥着举足轻重的地位。卫星技术的不断发展以及新兴应用的出现最终导致了多
随着遥感技术的迅速发展,使得多源遥感图像融合成为近几年遥感界研究的热点问题之一。近年来,多小波作为一种数学分析工具,取得了长足的发展,并广泛应用于图像处理的各个领域。论文针对多小波分解的高频部分在区域处理时易出现边界分歧的问题,结合多小波的性质提出一种新的遥感图像融合方法,主要工作包括:首先采用GHM、CL多小波把图像分解成不同尺度的高频和低频两部分,然后在不同频带选择不同的融合规则,在高频处理部
稀布阵天线不但可以减少天线单元以降低天线系统的工程成本,而且具有更大的自由度在阵列孔径上布置阵元,可以获取更加优越的天线性能。对于相同的天线数目和阵列孔径,稀布阵
近年来,随着通信技术的快速发展,人们对频谱资源的需求越来越大,无线电频谱资源已经成为一种稀缺资源。认知无线电由于其能发现频谱空洞并加以合理利用,很大程度地提高了频谱利用
本文讨论了深空通信中影响链路性能的因素,通过构建中继链路来提高通信质量,同时根据深空通信的特点分析了传统传输层的协议的局限性,并对其改进,为进一步研究深空通信提供了
水下噪声对水声目标探测、船舶工程和海洋研究都有重要作用,水声辐射噪声信号作为被动声纳探测的目标信号,一直都是研究的重点。但现有采集技术下获取的数据量很大,不利于在
目前,随着移动用户群的迅速增长和移动业务需求的多样化发展,作为第三代移动通信系统之一的TD-SCDMA系统,已经难以很好的保证用户的满意度,因此引入了高速下行链路分组接入(H
随着工业制造精度的不断提高,传统总线越来越多的表现出速度慢、数据量小的缺点。另一方面,一种将计算机网络应用于工业控制的总线技术越来越受到关注,这就是工业以太网。Eth