【摘 要】
:
随着人工智能和社交网络的飞速发展,越来越多的智能设备改变着人们的生活和交流方式。语音是人类交流最自然、最有效的方式之一,而随着智能设备深度融入人们的生活,使机器去理解人类表达的情感变得尤为重要。语音情感识别成为语音领域研究的热门方向之一。而基于深度学习的语音情感识别模型作为近年语音情感识别的主流模型同样存在着一些亟待解决的问题。目前,语音情感识别系统存在着情感识别率较低,情感特征不明晰的问题。而如
【基金项目】
:
中原千人计划中原科技创新领军人才项目(204200510021)
论文部分内容阅读
随着人工智能和社交网络的飞速发展,越来越多的智能设备改变着人们的生活和交流方式。语音是人类交流最自然、最有效的方式之一,而随着智能设备深度融入人们的生活,使机器去理解人类表达的情感变得尤为重要。语音情感识别成为语音领域研究的热门方向之一。而基于深度学习的语音情感识别模型作为近年语音情感识别的主流模型同样存在着一些亟待解决的问题。目前,语音情感识别系统存在着情感识别率较低,情感特征不明晰的问题。而如何设计网络结构提取有效的语音情感特征,完善现有的语音情感识别模型是研究的重点。因此,结合目前较成熟的深度模型,在此基础上进行网路结构的设计,选取更能提高情感识别率的情感特征,毫无疑问是目前语音情感识别重要的研究课题。针对以上背景,本文的主要研究和创新之处如下:1.根据传统声学特征和CRNN网络,提出了基于HSF-ACRNN的语音情感识别模型。首先建立端到端语音情感识别模型,其次探究不同特征对语音情感的影响。最后通过实验发现,传统的声学特征结合深度神经网络提取深度特征能更好的提升语音情感识别的准确性。基于此,本文对原始音频数据进行了不同的裁剪和映射,设计出了HSF-ACRNN情感识别模型,该模型能够较好地区分情感的种类。2.提取不同角度的语音情感特征,并进行特征融合,提出了基于时间金字塔池化的多特征语音情感识别模型。根据先前的研究发现,从不同角度提取的特征在不同的数据集表现不一,而将特征进行融合后能够较好且稳定的识别不同语音数据集的情感类别。基于此,本文从不同角度提取音频情感特征,通过时间金字塔池化算法获取到音频段级别特征,并将特征进行融合后,在三个语音情感数据集上进行实验,分别取得了3.8%、4.8%和17.41%的提升。3.为了发掘韵律对情感的影响,提出了结合韵律清洗的语音情感识别模型。情感的分类特征应当是非个性化的情感特征,分类的网络模型应结合认知理论而进一步改进和探索更深层次的语音情感特征。筛选和强化韵律等非个性化特征对于情感的识别会有更好效果。本文结合自监督学习模型提取语音表征并通过韵律编码器网络清洗韵律特征,对语音情感类别的识别有一定的提升。本文对语音情感特征选取和网络结构优化方面进行了研究,结合现有的成果,通过对不同数据集上的实验进行分析,得到了对语音情感识别结果较好地情感特征,完善了语音情感识别模型,并最终探究了音频本身韵律等非特个性化特征对情感识别的影响,取得了较好地识别结果。
其他文献
石墨烯作为一种新型的二维材料,具有优异的物理化学性质,因此受到了科研界和工业界的高度关注,但大规模、低成本生产石墨烯依然是一个挑战。等离子体气相合成石墨烯是近年发展的一种合成石墨烯的新方法,具有连续合成、无催化剂、操作简单等特点,展现出大规模合成石墨烯的潜力。目前对等离子体气相合成石墨烯的研究较少,工艺参数与产物特性之间关系尚无明确定论,石墨烯形成机理也存在着较大争议。本文发展了一种磁旋转非热电弧
随着文化产业在助推经济转型升级、产业结构优化和提升国民精神文化生活质量方面的作用日益突出,该产业已成为很多国家和地区的战略性支柱产业,政府部门将扶持文化产业作为大力提振经济的新引擎和制定相关经济政策的主抓手。在我国,积极发展文化产业除能有效助推经济发展外,还是坚定文化自信、坚持先进文化前进方向的重要基础和巩固国家文化安全的有力保障。近二十年来文化产业的蓬勃发展,同时也为深化我国国有文化资产监管机制
政府质量奖已成为国内各地区改善和提升质量管理的重要手段,在提高企业(组织)经济效益、改善区域整体质量状况方面效果显著。大英县十分重视实现政府质量奖的引导激励作用,然而实际效果却不甚理想。由于政府质量奖属于政府提供的公共产品,因此本文以大英县政府质量奖作为研究对象,对政府角色定位问题进行研究分析。本论文立足政府角色定位,首先概述了国内外研究状况和本论文的研究思路,综合政府质量奖、公共管理服务、准公共
[背景]现代技术与形态学相结合对性别、年龄等个体识别的判断意义重大。年龄作为判断刑事责任年龄的基础,在定罪和量刑,特别是刑事案件中青少年责任的判定具有重要的作用。进行年龄推断时,形态学和影像学一直是研究的热点,特别是影像学高准确性的优势更使其备受关注。受机体自身调控机制作用和外界环境影响,利用牙齿推断年龄有更高的稳定性,可信度和准确性。[目的]以影像学技术为手段,将10~20岁青少年四种类型牙齿全
近年来随着互联网等新媒体的高速发展,传统文化市场受到巨大冲击,豫剧作为传统的综合性戏曲艺术,也在多元文化背景下陷入了生存困境,戏曲的娱乐需求被大大削弱,受众群体出现了断层问题。随着大众文化娱乐的消费需求日益增多以及中国人民文化自信的崛起,对于中国传统文化的挖掘与设计成为文化产业的发展趋势,这给中国优秀传统文化在多元化时代的传播提供了新的展现平台与发展机遇。IP形象作为一个互联网时代的新生产物,这种
近年来由于极端天气事件频发,加之地震效应,引发大量堰塞坝漫顶溃决,导致漫顶溃决型泥石流灾害数量增多。漫顶溃决型泥石流是由非恒定水流逐渐侵蚀下游河床而形成的,区别于其它类型泥石流的形成过程。因目前对该类泥石流的形成机理认识不足,尚未建立反映真实泥石流形成过程的判识模型。本文利用水槽实验,分析不同实验条件下漫顶溃决型泥石流的形成过程,然后建立漫顶溃决型泥石流的判识模型,旨在识别漫顶溃决型泥石流的形成位
随着机动车保有量的不断提升,城市道路交通负荷日益严重。城市快速路的建设虽然对缓解交通拥堵起到了一定作用,但由于快速路交织区内交通流的复杂性,仍然容易形成阻塞。因此,对快速路交织区交通运行特征及规律的研究显得尤为必要。本文以城市快速路交织区为研究对象,应用无人机采集了实际交通流运行数据,在对城市快速路交织区交通流特性分析的基础上,构建了城市快速路交织区仿真模型,对不同影响因素情景下交织区交通运行状况
在自然界中,生物为了适应不断变化的环境,逐渐演化出具有特殊功能的表界面微纳结构,这些跨尺度复合结构赋予生物不同特性,例如荷叶具有“两面神(Janus)”润湿特性(上表面超疏水,下表面超亲水),而使荷叶能够稳定漂浮在水面上;叶片气孔能够对光照强度的大小做出开孔/闭孔自适应行为,从而调谐其内部物质交换。师法自然,研究人员受这些生物特性的启发,提出了仿生Janus锥孔超浸润膜和多孔门控膜,并初步探究了仿