论文部分内容阅读
随着科技的极速发展,人工智能逐渐出现在人们的视野中,计算机和人对话变成现实,同时人们还希望计算机可以理解人的喜怒哀乐。因此,人们也想方设法研究用计算机技术识别人的情感的方法,即语音情感识别技术。目前,语音情感识别技术的用途之广已逐渐显现,主要可用在医学领域、服务行业以及教育事业等。随着人工智能的发展,语音情感识别方面的研究越来越在人类生活的方方面面体现出其理论价值和应用价值。首先,论文研究了典型的语音情感的分类方式和几种情感类型的特征参数,分析了基音频律、振幅能量、共振峰、梅尔倒谱系数等特征参数的提取方法和过程。其次,论文提出一种基于主成分分析法选择特征参数的方法,提高了主特征识别率。再其次,论文研究了常规语音信号的处理方法,包括语音信号的数字化处理、预加重、分帧、加窗以及端点检测等预处理操作。接着,论文研究了对小样本分类具有较高识别率的支持向量机模型,然后通过Fisher准则调节类间间隔,通过最大熵原理准则有效实现类内均匀分布,以改善传统支持向量机核参数训练速度慢的不足。最后,论文针对柏林语音数据库选取高兴、生气、害怕、悲伤、平静5种情感,分别采用支持向量机、Fisher准则优化核参数、最大熵原理优化类内核参数、以及本文提出的Fisher准则与最大熵原理融合方案进行了测试和验证,测试表明,本文提出的方法能明显提高核参数训练速度,同时不影响对几种语音情感信号的识别率。