论文部分内容阅读
随着人工智能技术的发展及智能设备的普及,命令词识别作为语音交互手段的关键技术之一,已成为一个重要的研究内容。尤其在噪声干扰情况下确保命令词识别的鲁棒性,逐渐受到学术界和工业界重视,是一个迫切需要解决的难点。本文主要针对噪声环境下命令词识别的准确性提出有效的解决方法,并将命令词识别关键技术应用于呼吸音识别。本文工作主要包括:1、为确保噪声环境下命令词识别的准确性,提出了混合条件训练的方案,分别实现了基于HMM-ML和DNN-HMM的命令词识别系统,完成了基于King-ASR-L-057和自制命令词数据库的带噪命令词识别实验。实验结果表明,在不同噪声情况下,采用混合条件训练的DNN-HMM方案,能够获得更高的正确识别率。2、提出了 MFCC定点化实现方案,以减少系统对硬件资源的需求。在干净命令词数据库上,基于HMM-ML系统框架,分别对比了定点化MFCC和浮点MFCC的识别效果,发现13维和39维定点MFCC分别能获得92.12%和98.40%的识别效果,在加噪情况下同样能完成一定噪声强度的命令词识别,验证了定点MFCC提取流程和结果的正确性。3、针对呼吸音识别问题,采用命令词识别关键技术,搭建了基于HMM-ML、HMM-MCE和DNN-HMM的呼吸音识别系统,并采用自制的呼吸音采集设备收集了一定规模的呼吸音数据库。完成了呼吸音的正常/异常二分类识别实验,最优条件下采用DNN-HMM呼吸音识别系统能获得95.59%的识别效果。