论文部分内容阅读
随着计算机技术的不断地发展与应用以及智能化不断地提高,与机器进行交流,能让机器能够明白人类的语言,这是人类长期以来所期望的,正是因为这种期望和需求推动着语音识别技术快速发展并得到应用。在近几年,语音识别已经被广泛地应用到了各个领域中,例如家电、手机等等。一直以来,语音识别技术因为具有着非常重要地研究价值和意义以及广泛地应用前景,而受到了研究人员和各个领域的重视,并投入越来越多的精力来做研究。本文将介绍语音识别的识别过程、基本原理及组成部分,语音识别过程包括:预处理、特征提取、训练、识别决策、阈值比较等模块。总的来说,语音识别技术主要包括有特征提取技术、模式匹配准则及模型训练技术三个方面,即选取一定的声音特征,然后运用一定的模型算法对语音信号建立独有的模板库后进行逐一模板匹配,最终得到最佳识别结果。
本文主要对语音识别过程中的端点检测、特征参数提取及识别决策等几方面进行研究,并提出了自己的一些想法,主要内容大概如下:
1、本文分析了语音信号端点检测一些传统方法,并提出了一种利用双门限能量法与神经网络法相结合的方法,为语音信号检测端点进行了分析,表明本文所提出控制方法的有效性相对于其他常见的方法有提高识别率。
2、本文分析了各种常用的语音信号特征参数系数,及其提取算法。分析已有研究结果的优缺点。并在已有的算法的基础上,研究提出一种优化的算法,融合了小波变换、LPCC参数和MFCC参数的算法;通过Matlab软件仿真验证其整体动作的合理性、有效性。
3、本文分析了识别决策,最常用的识别决策算法是Viterbi算法。但是在识别过程时,受各方面的影响,出现误差,在本文中,用Viterbi算法得出的识别结果,再经过一次阈值比较,提高语音识别率。关键是计算出合理的阈值,阈值是在特定环境下,经过多次实验而得到的一个经验值。
4、本文最后分别在轮式机器人和Android(安卓系统)平台下做应用实验,实验表明这是一种高效的、稳定的、实用性强的、高识别率的语音识别系统。