论文部分内容阅读
现代社会中机器在人们的生活中无处不见,现在以键盘为主的人机交互界面必须手眼并用的操作,而且比较难度,技术度比较高。为此就需要研究一种更加友好方便的人机交互界面。语音是人类交流最自然方便的方式。通过语音对机器进行控制可以使人机交互的效率大大的提高。要实现人机的语音交互就必须提高语音识别的实用性,本文所做的就是语音识别控制技术的研究。本文研究设计了一个特定人、小词汇量、孤立词语音识别控制系统。本论文分析和比较了动态时间规整(DTW)和隐马尔柯夫模型(HMM)两种识别算法的优缺点。考虑到系统的要求是设计出一个特定人、小词汇量孤立词语音识别系统,动态时间规整(DTW)可以满足系统的设计要求,因此算法选定为动态时间规整。该算法的思想就是将动态规划的思想用于解决语音识别中的语速多变的问题,使得未知单词的时间轴不均匀的扭曲或弯折,以便使其特征与模板特征对正。识别的过程就是将语音信号进行预处理后,提取语音信号特征,采用一定的测度,计算识别语音与模板语音的失真,确定识别结果。本文对基于DTW算法的小词汇量语音识别系统进行了系统设计,关键技术研究,进行了软件设计,论文重点研究了对孤立词语音识别意义重大的端点检测技术,并对当前最常用的几种特征参数:LPC、LPCC、MFCC参数进行了详细研究,并选取MFCC做为本研究的特征参数。针对DTW算法存在的两个最大的缺陷:一是对端点的敏感性;二是运算量较大;对传统的算法上进行了改进,提高了运行速度,取得了很好的效果。软件系统通过双线程实现了对语音信号的实时采集和识别。本文最后通过Matlab仿真对识别系统进行了性能测试。仿真所使用的数据是采用麦克风,利用成熟的计算机声卡技术采集语音信号。本文重点对数字和开、关等命令词进行了端点检测的仿真和DTW语音识别的仿真,得到很好的识别效果。