【摘 要】
:
语音是人类交流的重要手段,是相互传递信息中最方便、最基本和最直接的途径。语音信号在传达语义信息的同时,还传递着情感信息,而情感在人们的交流中起着重要的角色。因此,随
论文部分内容阅读
语音是人类交流的重要手段,是相互传递信息中最方便、最基本和最直接的途径。语音信号在传达语义信息的同时,还传递着情感信息,而情感在人们的交流中起着重要的角色。因此,随着人机交互技术的快速发展,语音信号中的情感信息正越来越受到研究人员的重视,特别是在语音合成和语音识别等领域。长期以来情感智能研究只存在于心理学和认知科学等领域,但是近年来随着信息技术的高速发展和人类与计算机关系的日益密切,如何实现计算机的拟人化,能感知周围的环境、情感等内容,已成为了人机交互能力的重要标志和目标。情感智能和计算机技术的结合使之产生了情感识别这一崭新的研究课题。语音信号的情感识别也可以看作是模式识别的问题,研究者通常会提取很多语音特征作为情感特征,将提取的语音特征输入到分类器进行情感识别。论文重点研究了基于BP神经网络的语音情感识别。主要研究内容如下:(1)语音信号的前端处理。对情感语句进行了有效的预加重、加窗和端点检测处理,研究了短时过零率和短时能量的提取方法,比较和分析了基音周期的估计算法,通过研究前人提出的方法改进了基音周期估计算法。(2)语音情感特征参数的分析和提取。对大量的情感语句的特征变化规律进行了统计分析,研究了与情感相关的特征信息,确定了用于语音情感识别的16个特征值,并组成了16维特征向量,包括:第一共振峰、第二共振峰、第三共振峰的最大值、最小值和平均值;平均短时过零率的最大值;基音频率的均值,最大值和最小值以及短时能量的最大值、最小值和平均值。(3)由于提取的特征矢量是高维的,而且具有一定的相关性,即存在一定的冗余。因此本文对神经网络训练集中的样本作了归一化处理,然后作了主成分分析,既降低了输入的特征矢量的维数,同时也去除了冗余信息。本文还分析了BP神经网络的结构、原理和存在的缺点,在MATLAB6.5实验环境中,将两种改进的BP算法用于识别语音情感,与传统的BP算法相比,改进的BP算法无论从识别率还是收敛速度上都有了一定的提高。
其他文献
随着信息技术和计算机网络的飞速发展,人们的日常生活越来越网络化和信息化。数字电视,视频点播,电子商务越来越多的走进了千家万户,与此同时,出于各种目的的盗版,知识产权侵
随着以Web为中心的应用程序的发展,业务系统越来越复杂以及企业要求开发配置的应用越来越大,为了解决这种问题,SUN公司推出了J2EE。J2EE提供了一整套面向企业级运算的应用方
随着多媒体技术和计算机网络的快速发展,数字媒体的制作和传播变得更加方便和快捷,同时盗版和侵权的问题也日益严重。多媒体信息安全成为一个非常重要的现实问题。数字水印技
随着现代社会的快速发展,各种信息大量涌现,加强信息传输的保密性、提高信息处理的智能性、减小系统体积和功耗等方面就成为未来科技发展的重要趋势。新的电路元件忆阻器的出现,给这一问题的解决带来了曙光。忆阻器件具有纳米尺寸、自动记忆和非线性特性等优点,将忆阻器引入到非线性电路设计中,构建的忆阻混沌系统在体积和功耗等方面都更具优势,产生的混沌信号可以用在保密通信、天气预测和图像加密等领域。利用忆阻器天然的自
在网络互连中,路由发挥了重要的作用。利用它一方面能够找到最优的路径;另一方面能够尽可能减小由路由引起的开销,从而提高路由协议的性能。迄今为止,大量的路由方案已被广泛
随机数在信息安全和计算领域具有广泛的应用。在信息安全领域,随机数可用于密钥管理、数字签名以及身份认证等众多安全技术中,以确保信息的机密性、真实性和完整性;随机数也可
随着多媒体调度的应用逐渐普及,多媒体调度对系统设计提出的要求不断增加,催生了基于网络的远程多媒体调度系统。网络的迅速发展和硬件性能的提升,使得数字化,多样化,智能化
在21世纪,无线通信技术的高速发展,已经渗透到人们生活工作的方方面面。传感器技术的突飞猛进,使得高性能、低功率、小型化的传感器实现成为可能,加以人们对自身健康的关注程
随着汽车工业的快速发展,汽车的拥有量也在迅速增加。汽车成为了人们工作与生活中必不可少的交通工具。但随着汽车行驶里程的增加、使用时间的延续,其技术状况必然发生改变。
近年来随着移动互联网的兴起,数据业务呈现爆炸式的增长,对无线通信网络提出了更高的容量要求。随着物理层技术的不断发展,链路性能的提升已经逐渐达到极限。与此同时,异构网技术