基于流形学习的语音情感识别方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:jnd411525477
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别是指利用计算机分析说话人的情感状态及变化,进而确定其内心情绪或思想活动,实现人机之间更自然更智能化的交互一种技术。语音情感识别的研究对于增强计算机的智能化和人性化,开发新型人机环境,以及推动心理学等学科的发展,有着重要的现实意义,并最终产生很大的经济效益和社会效益。   本文在综述课题研究背景和国内外已提出的流形学习及语音信号情感特征的提取、特征降维识别等方法基础上。主要研究了基于流形学习的语音情感特征降维和情感识别的一些关键问题,提出了一些改进方法,并通过实验进行了有效性验证。本文的主要工作如下:   (1)提出基于增量子流行的语音情感特征降维方法。面对高维的语音情感特征参数,如何消除无关和冗余特征并能够实现对测试样本的增量学习是个很重要的问题。本文提出基于增量子流行的语音情感特征降维方法,该方法用LLE将初始的训练特征维数降至目标维数,再用增量子流形学习的方法求得测试样本的低维特征,不但减少冗余信息的影响,而且提高特征的利用率和降维复杂度,最终提高分类识别的准确率。   (2)定义半监督情况下的概率距离计算方法,改进流形学习过程中邻域信息的确定方法,使流形学习更加具有泛化能力,并把相关应用扩展与半监督学习结合,为后续半监督语音情感识别起基础铺垫作用。   (3)提出基于概率距离流形和图模型半监督学习的语音情感识别方法。重新定义基于标签传递的识别方法中的相关矩阵和向量,并根据算法的需要明确区分概率矩阵和标签矩阵的定义和作用;改进并提出基于概率距离流形学习的半监督识别算法中无标记数据标记确定方法,从而形成了完整的识别方法。为了验证方法的有效性,设计了不同的实验应用于语音情感识别。   (4)采用面向对象思想并利用Matlab和VC结合的开发方式,设计实现基于流形学习的语音情感识别原型系统,从应用角度验证了上述方法。  
其他文献
可靠性理论起源于20世纪30年代初,但对系统进行可靠性分析则是从20世纪40年代开始的。最开始可靠性理论是运用统计方法于工业系统的质量控制中。二次大战期间,许多大型复杂系统
随着社会的发展和科技的进步,图像识别作为计算机视觉的重要组成部分,获得了长足的进步。传统的目标识别任务需要进行繁杂的图像预处理,且需根据识别目标的具体特征设计专门的特征提取方法,通过传统方法所获取的分类器识别精度低,且适应能力较弱。针对传统方法在目标识别领域的不足,本文基于深度学习技术,设计改进的卷积神经网络实现图像识别,利用神经网络强大的特征学习能力提取图像信息,以此提高图像识别模型的检测性能。
学位
说话人确认技术用于判断给定语音是否属于某个说话人,它作为一项关键的语音辅助应用技术,现阶段已经受到广泛的重视,并作为身份认证技术普遍应用于各种相关领域。而在已有的
软件测试是保证软件质量的关键性工作,在软件开发周期中占有非常重要的地位。软件测试的工作量随着软件产品规模不断扩大以及软件复杂性越来越高而迅速增长。为了降低软件测
随着网络应用范围的越来越广,其在人们的生活和社会中扮演越来越重要的角色,但是网络的安全问题也随之而来。自1996年初发现分布式拒绝服务攻击(DDoS)以来,DDoS攻击被广泛用
近年来,无线传感器网络技术得到了快速发展,被广泛应用于军事国防、医疗卫生、环境监测、智能家居、公共安全、抢险救灾等诸多领域。传感器节点的定位是无线传感器网络应用的
交通事故现场绘图系统是用来辅助中国及世界上其他国家交通警察处理交通事故现场勘查和绘图的系统软件。本系统的目的是建立一个基于矢量图的图形绘制系统,通过基本图元的绘
当今,3G技术迅猛发展,本文主要是在研究了移动增值业务之后,借鉴彩铃业务的成功应用,给出了一种将移动通信与Internet相有机结合的多媒体彩像业务的实现方案。多媒体彩像业务
随着科学技术的发展迅速,人脸表情识别近年来突飞猛进,人脸表情识别越来越受到关注,如何方便有效地实现人脸表情识别,已经成为人们日益关心的问题。人脸表情识别的能够自动识
随着人工智能技术、计算机技术、电子技术和信号处理技术的飞速发展,机器人技术在近些年取得了巨大的进步,机器人技术的应用领域也非常广泛。目前,在工业、农业和军事已经研