用于设备控制的语音识别系统的研究

来源 :大连海事大学 | 被引量 : 6次 | 上传用户:jack607
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会中机器在人们的生活中无处不见,现在以键盘为主的人机交互界面必须手眼并用的操作,而且比较难度,技术度比较高。为此就需要研究一种更加友好方便的人机交互界面。语音是人类交流最自然方便的方式。通过语音对机器进行控制可以使人机交互的效率大大的提高。要实现人机的语音交互就必须提高语音识别的实用性,本文所做的就是语音识别控制技术的研究。本文研究设计了一个特定人、小词汇量、孤立词语音识别控制系统。本论文分析和比较了动态时间规整(DTW)和隐马尔柯夫模型(HMM)两种识别算法的优缺点。考虑到系统的要求是设计出一个特定人、小词汇量孤立词语音识别系统,动态时间规整(DTW)可以满足系统的设计要求,因此算法选定为动态时间规整。该算法的思想就是将动态规划的思想用于解决语音识别中的语速多变的问题,使得未知单词的时间轴不均匀的扭曲或弯折,以便使其特征与模板特征对正。识别的过程就是将语音信号进行预处理后,提取语音信号特征,采用一定的测度,计算识别语音与模板语音的失真,确定识别结果。本文对基于DTW算法的小词汇量语音识别系统进行了系统设计,关键技术研究,进行了软件设计,论文重点研究了对孤立词语音识别意义重大的端点检测技术,并对当前最常用的几种特征参数:LPC、LPCC、MFCC参数进行了详细研究,并选取MFCC做为本研究的特征参数。针对DTW算法存在的两个最大的缺陷:一是对端点的敏感性;二是运算量较大;对传统的算法上进行了改进,提高了运行速度,取得了很好的效果。软件系统通过双线程实现了对语音信号的实时采集和识别。本文最后通过Matlab仿真对识别系统进行了性能测试。仿真所使用的数据是采用麦克风,利用成熟的计算机声卡技术采集语音信号。本文重点对数字和开、关等命令词进行了端点检测的仿真和DTW语音识别的仿真,得到很好的识别效果。
其他文献
3G网络建设中,新型的建网核心思想是利用射频拉远技术。基于这一新技术,将传统的宏基站的基带处理单元和射频部分分离,分成基带处理和射频拉远两个单元,在两个单元之间采用光纤连
互感器是电力系统中最重要的测量设备之一,在电流/电压测量和继电保护中起着不可替代的作用。随着电力系统传输容量的不断增大及电压等级的不断提高,传统的电磁式互感器在绝缘
Ad Hoc网络技术是目前无线通信领域研究的热点问题。Ad Hoc网络无需固定基础设施的支持,具有组网方便快捷、可靠性高、灵活性强等优点,其应用越来越广泛。随着各种智能化、小
目前,我国的印刷行业仍然处于劳动力密集、工艺复杂的发展阶段。在当今效率与质量并重的市场环境中,企业从接受订单到提供成品,整个流程仍然要面对许多问题。引入先进的数字
学位