论文部分内容阅读
自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让机器能听懂人类的语言并能按人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,语音识别(Speech Recognition)技术的出现,使人类的这一理想得以实现。语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的技术,它已成为计算机在亿万百姓中普及所需的关键技术,并且必将成为未来计算机的重要特征。 语音识别系统的研究持续了近40年,已经形成了完整的理论体系,目前语音识别的研究也已经进入了商品化阶段,基础性理论相当完善,各种各样的产品也相继涌现,但在许多特定领域,由于环境和行业的特殊性,往往需要专门进行开发,以适应实际需要。语音识别技术在安静的环境中已经达到了令人鼓舞的准确率,但是在实际应用时由于噪声的引入和环境的改变通常会使系统识别准确性显著下降。本课题基于现有语音识别系统的技术特点,提出了一种噪声环境下的语音识别系统改进方案。 现有语音识别系统的识别方法主要有预处理、端点检测、特征提取以及模式匹配等,本课题在深入理解传统语音识别基本原理的基础上,做了适当的改进:首先是对语音信号特征提取方法的改进,分别采用了两种改进型的特征提取方法:单边自相关LPC系数法和线性预测误差法,在验证这两种方法具有比传统线性预测编码LPC法更强抗噪性能的基础上,又比较了这两种方法的差异。其次在传统的DTW(Dynamic Time Warping)语音模式匹配的基础上,通过对搜索宽度限制和整体路径约束等方法,使得系统能够实现快速的识别响应,尤其是对于小词汇量和特定人识别,可以有效的提高系统识别率和响应速度。 本课题用C语言将改进的语音识别算法编程实现,并在PC机上对其性能进行了仿真,给出了仿真计算结果。实验结果表明,与传统的语音识别系统相比,改进过的语音识别系统能够有效的克服噪声干扰,减小或者消除噪声所带来的训练模型和测试语音之间的失配,并且提高系统的响应速度。论文所做的工作,为噪声环境下的语音识别提供了理论分析与仿真实验数据。