基于卷积神经网络的语音情感识别方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:kangyue_1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和人工智能技术的发展,目前市面上出现了智能音响、语音助手等产品。而机器如果能做到语音情感识别,就可以提供更友好的用户体验。除此以外,语音情感识别在抑郁患者治疗、线上远程教育等方面有着广阔的应用前景。随着深度学习在语音情感识别领域中得到广泛应用,语音情感识别准确率也得到了有效的提高,然而目前语音情感识别仍然有许多的研究难点。情感信息不均衡的分布在语音信号上,在这种情况下如何提取更为有效的特征,这对网络结构提出了更为严格的要求。同时在大部分基于深度学习的语音情感识别研究中,深度学习模型的输入是手工设计特征。特征的提取方式也影响着识别率。针对上述情况,本文联系语音的上下文信息聚焦于对情感分类更有用的语音部分,以及使用深度学习模型直接对原始语音信号提取特征。首先本文从语音中的情感信息分布不均衡出发,通过1D-Res Net提取各个时刻的特征,再加入自适应池化模块。自适应池化模块联系了语音上下文信息预测每个时刻特征的权重,将所有时刻特征的加权平均值作为最终的特征,进而送入全连接层分类。权重通过网络学习得到,用来调整不同时刻特征在融合后的全局特征中的贡献程度。同时本文不仅从正向序列预测每个时刻特征的权重值,也从反向序列得到另一组权重值。通过实验验证了联系语音上下文信息预测权重值的自适应池化模块的有效性。其次本文结合文献分析了语音的强标签形式。本文对上述中基于上下文信息预测重要性分数的模型加以改进,根据这种强标签情况,构建关键帧损失函数,对重要性分数加以显式约束,使其趋向于0或1,从而更符合强标签的有无情感信息情况。同时本文也加入中心损失函数,在训练过程中逐渐减小类内距离和增加类间距离。最终实验结果也表明了关键帧损失函数和中心损失函数可以提高模型的识别准确率。最后本文从神经网络的输入出发。在语音情感识别研究中,大部分深度学习模型的输入是手工设计特征。获得手工设计特征的过程可能存在信息丢失,因此本文构建并使用金字塔形网络直接对每一帧原始语音信号提取特征。另一方面,因为有关于语音方面的手工设计特征根据人的先验知识设计得出,在语音相关的领域中被广泛的使用,有着良好的表现。因此本文将金字塔形网络提取的特征与MFCC融合,进而得到表征能力更强的特征。最终实验验证了金字塔形网络提取的特征和融合特征的有效性。
其他文献
随着我国纳税人需求的不断攀升和需求种类的多样化,税务机关有限的服务资源与纳税人日益增长的服务需求之间的矛盾日益突出,探索以纳税人需求为导向的分类纳税服务模式已成为摆在税务机关面前的重要课题。本文从纳税人需求视角出发,通过对A县税务局纳税服务体系现状的分析,指出其纳税服务中存在的问题,并剖析其原因,进而针对A县税务局纳税服务需求开展问卷调查,最终,提出纳税服务体系的优化应以纳税人的需求为基础,实施个
近年来,第五代移动通信技术飞速发展,其在第四代通信技术的基础上,对移动通信技术提出了更高的要求。自从极化码被确定为5G增强移动宽带场景的控制信道的短码编码方案后,极化码又重新进入了研究学者们的视线里。作为首个被证明理论上可以达到香农限的编码方案,极化码的译码算法研究价值是毋庸置疑的。极化码在码长较长的情况下目前使用的译码算法译码复杂度和时延较高,使得极化码在低时延的通信系统中(例如5G URLLC
由于镁合金具有密度低、机加工性能优良、零件尺寸稳定、易回收等一系列优点,所以在航空、航天、汽车、计算机、通信和家电等行业已经有多年的应用历史。低成本高性能一直是镁合金研究的热门方向,所以通过添加成本较低的合金元素来改善合金的性能是很有必要的。本文使用金属型铸造,以Mg-Zn-Ca合金为基体,通过向其中单独添加Al(1-4)wt.%和混合加入Al(1-4)wt.%、Sn(0.5-1.5)wt.%,研
辽河三角洲保护区湿地地处于辽东湾,湿地面积在其中位居首位,在我国滨海湿地位置中也占据着重要地位。因为人们缺乏对于维持湿地生态系统重要性的认识,随着人们对于湿地开发
气体钻水平井将气体钻井保护储层与水平井扩大渗流面积的优点相结合,是解决低压、低渗、低丰度致密气藏高效开发的重要技术手段。但是,伴随气体钻水平井的一个难题是水平井段
市场上大约60-70%药物的靶点位于细胞膜上,并且药物与细胞膜的相互作用能够直接影响机体对药物的吸收、分布与排泄等功能。因此,充分了解药物对脂质膜的内在影响对相关疾病的诊断和病理研究具有至关重要的意义。本文利用荧光倒置显微镜研究了局部麻醉药物盐酸丁卡因(Tetracaine,TTC)与二元及三元支撑脂质双分子层(SLBs)的相互作用,并对支撑脂质双分子层中脂筏的形成条件进行了探索。研究结果表明,T
经济环境的不断发展给企业经营带来了新的机遇和挑战,企业的组织形式及合作模式也随环境的不确定性不断改变。战略联盟作为一种新的经营资源的整合载体越来越受到市场中企业的关注。通过什么样的选择方式建立联盟关系决定了合作伙伴间知识搜索的效果,继而影响战略联盟创新绩效。因此,系统研究联盟企业伙伴选择、知识搜索、创新绩效三者之间关系对促进联盟企业自身实现企业发展战略,推动联盟共同绩效具有重要意义。本文首先通过大
川中地区中二叠统茅口组发育了一套优质白云岩储层,但分布极不稳定,似乎与岩溶作用有关,该白云岩储层形成的主控因素究竟是白云石化作用还是岩溶作用,且它们之间的关系尚不清
板料冲压是汽车制造过程中的重要生产方法,冲压件成形质量的优劣对汽车的生产成本和生产效率都会产生很大的影响。金属薄板的各向异性与拉-压强度差效应(SD效应)在板料成形过程中决定着成形件的精度与质量。因此,如何准确描述板料成形过程中的塑性本构关系以及力学性能,对塑性成形理论的发展具有重要推动作用,对实际生产将具有重要的工程应用价值。本文以汽车轻量化中金属薄板的成形过程为背景,以金属塑性成形原理为基础,
琼胶酶是一种能够降解琼脂以形成琼脂糖寡糖的糖苷水解酶,根据琼胶酶水解糖苷键的不同,可以分为α-琼胶酶(EC 3.2.1.158)与β-琼胶酶(EC 3.2.1.81)两类。目前,野生菌株生产琼胶酶存在诸多问题,缺点包括产酶量低、易污染、生长慢等,不利于大规模工业化生产。基于以上问题,本课题将一段弧菌琼胶酶蛋白基因重组于表达载体pET30a(+)上,然后转入宿主大肠杆菌BL21体内,通过宿主大肠杆菌