基于特征补偿和ARM平台的鲁棒语音识别算法实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:allsky_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术在实验室环境下获得了良好的系统性能,但是应用环境的复杂性严重影响了语音识别的性能,同时当前基于计算机软件和在线语音识别系统受到应用设备条件等限制,因此开发鲁棒、小型化、离线的语音识别系统,具有重要的应用价值。本文针对以上问题,主要研究基于多环境模型矢量泰勒级数特征补偿的鲁棒语音识别系统以及在嵌入式系统上的开发和移植,同时实现基于ARM A8平台的优化,以此提高语音识别系统的适用性。  论文的主要研究工作如下:  (1)研究了语音识别系统结构、性能评价参数和鲁棒识别技术。本论文使用了基于短时能量和短时过零率的双门限端点检测。选择美尔倒谱系数(MFCC,Mel-Frequency Cepstral Coefficients)以及一阶差分MFCC作为本论文使用的特征参数,利用隐马尔科夫HMM(Hidden Markov Model)模型作为声学模型,选择ARM A8作为开发平台,并选择嵌入式Linux系统作为片上开发系统。  (2)分析了多环境模型的矢量泰勒级数(VTS,Vector Taylor Series)特征补偿算法,完成ARM A8硬件开发环境的搭建,实现了基于ARM A8和多模型VTS特征补偿的非特定人孤立词识别系统,包括音频处理模块,预处理模块、端点检测模块、特征提取模块、多环境模型特征补偿模块和识别模块,并进行了仿真测试和结果分析。  (3)优化了基于ARM A8和多环境特征补偿的嵌入式语音识别系统,其中分为硬件配置优化和算法优化。在硬件配置优化部分完成基于浮点库和基于协处理器两种优化。在算法优化部分完成对数指数运算的优化,关于最佳迭代次数的优化,匹配模型选择的优化,识别模块算法的优化。分别测试优化方法前后的性能差异,并分析其中差异发生的原因。通过设定对优化方案的组合,达到实时语音识别以及环境适应性的要求。
其他文献
随着互联网的发展,单一的身份认证逐渐不能满足越来越多网络应用的安全需求。本文提出并实现了一种新的安全访问控制系统模型UpswingPMI(改进型PMI),它在身份认证的基础上对
近十几年来,随着计算机和通信技术的迅猛发展,以软交换为核心的下一代网络(NextGenerationNetwork)的发展和部署是当前电信领域极为关注的热点。同时,市场对于增值业务的要求在
学位
本文作者将SAPS的研究与应用引入支撑系统领域,正是为了解决上述问题。具体讲,一方面,利用SAPS的复用思想、复用作用以及现有研究成果,可为支撑系统提供一种能提高构建效率、保证
随着交通事业的蓬勃发展,大跨度桥梁相继建成,人们对这些大型重要桥梁的安全性、耐久性日渐关注,桥梁健康监测系统和智能控制技术相继采用,并得到迅速发展。基于振动的识别是桥梁
本论文致力于混沌保密光通信技术的理论研究和仿真实验。一方面深入研究基于半导体光放大器(SOA)的光纤环状激光器的工作原理及其主要特性,建立一种基于SOA环状激光器的混沌通