论文部分内容阅读
在人工智能飞速发展的今天,机器若要真正实现智能化,则必须要能够理解人类的情感,所以对于人类语音情感识别的研究显得尤为重要。本文选用柏林语音情感库,在传统SVM用于语音情感识别的基础之上,提出了一种多级分类算法,平均识别率较传统SVM方法提高了5.42%;然后本文又利用PCA来进行特征优选,将优选后的特征用于语音情感识别实验,所得七种情感的平均识别率也较传统SVM方法提高了5.24%;最后本文将多级分类与PCA相结合,在每一级判决器上都采用PCA来进行特征优选,最终得到七种情感的平均识别率较传统SVM方法提高了7.85%。本文研究了如何对语音文本进行端点检测,并研究了MFCC、基音频率、共振峰、Delta特征、短时过零率、短时能量等情感特征的提取方法。采用所提取到的情感特征并利用传统SVM方法进行语音情感识别获得了58.69%的平均识别率。由传统方法所得出的混淆矩阵,本文引入了混淆度的概念,从而提出了一种多级分类构造算法,即将容易区分的情感先分开,然后再对易混淆的情感进行分类,逐级地判断出待识别语音的情感类型。与传统SVM进行语音情感识别相比,基于多级分类的语音情感识别平均识别率提高了5.42%,从而证明了该多级分类算法确实能够提高语音情感的识别率。然而,由于所涉及语音特征较多,算法对运行速度和存储空间都有较高的要求。本文采用PCA来优选特征,将PCA与传统SVM方法相结合得到的平均识别率较传统基于SVM方法提升了5.24%,从而证明了PCA用于特征降维并优选特征确实能够提高情感识别率。最终将多级分类与PCA特征降维相结合,从而得到七种情感的平均识别率为66.54%,与传统基于SVM方法进行语音情感识别进行对比,该方法得到的平均识别率提高了7.85%,从而证明了本文所提出的方法的正确性。