噪声环境下的语音识别算法的研究与仿真

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:seniorma21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让机器能听懂人类的语言并能按人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,语音识别(Speech Recognition)技术的出现,使人类的这一理想得以实现。语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的技术,它已成为计算机在亿万百姓中普及所需的关键技术,并且必将成为未来计算机的重要特征。 语音识别系统的研究持续了近40年,已经形成了完整的理论体系,目前语音识别的研究也已经进入了商品化阶段,基础性理论相当完善,各种各样的产品也相继涌现,但在许多特定领域,由于环境和行业的特殊性,往往需要专门进行开发,以适应实际需要。语音识别技术在安静的环境中已经达到了令人鼓舞的准确率,但是在实际应用时由于噪声的引入和环境的改变通常会使系统识别准确性显著下降。本课题基于现有语音识别系统的技术特点,提出了一种噪声环境下的语音识别系统改进方案。 现有语音识别系统的识别方法主要有预处理、端点检测、特征提取以及模式匹配等,本课题在深入理解传统语音识别基本原理的基础上,做了适当的改进:首先是对语音信号特征提取方法的改进,分别采用了两种改进型的特征提取方法:单边自相关LPC系数法和线性预测误差法,在验证这两种方法具有比传统线性预测编码LPC法更强抗噪性能的基础上,又比较了这两种方法的差异。其次在传统的DTW(Dynamic Time Warping)语音模式匹配的基础上,通过对搜索宽度限制和整体路径约束等方法,使得系统能够实现快速的识别响应,尤其是对于小词汇量和特定人识别,可以有效的提高系统识别率和响应速度。 本课题用C语言将改进的语音识别算法编程实现,并在PC机上对其性能进行了仿真,给出了仿真计算结果。实验结果表明,与传统的语音识别系统相比,改进过的语音识别系统能够有效的克服噪声干扰,减小或者消除噪声所带来的训练模型和测试语音之间的失配,并且提高系统的响应速度。论文所做的工作,为噪声环境下的语音识别提供了理论分析与仿真实验数据。
其他文献
随着计算机多媒体技术、信息技术和网路技术的飞速发展,以数字设备制作、以数字形式存储、处理和传输静态图像或动态图像的需求越来越多。由于数字图像信息量很大,存储时将占
超宽带是近年来蓬勃发展的一门技术,它凭借传输速率高、消耗电能小、保密性高、抗多径衰落能力强等优点引起了无线通信、网络、雷达、成像和定位等方向的广泛关注,特别是成为
目前,我国的计算机网络容易受到直接搭线窃听、截取、重放、伪造、假冒、篡改或删除信息等攻击。因此,增强信息网络的安全是一个现实而紧迫的课题。身份鉴别是网络安全的一道重
现代化战争条件下多源信息融合系统高度依赖于一个庞大、复杂的网络,为系统的可靠性带来很大的风险。历史经验表明,在所依赖的主要技术系统失效后要继续维持作战能力几乎是不
本文以传感器网络中的节能技术为主线,在介绍了WSN的特点、应用和近年来研究进展等问题之后,对2002年后提出的18种节能MAC协议进行了总结,按照组织性这种较新的分类方法对协议进
正交频分复用OFDM(Orthogonal Frequency Division Multiplexing)技术以其频谱利用率高、成本低、易实现等优点而备受关注,预计将成为3G以后移动通信的主流技术。近年来随着移
雷达三维成像在对外空目标如卫星、空间碎片和空间站进行跟踪、识别以及对天体的观测等领域具有重要的应用前景。目前对运动目标进行三维成像的常规方法是利用多天线的干涉逆
仿生算法是优化算法领域中出现的一类比较新型的智能算法,一般具有不确定性,潜在的并行性,进化性等特点,是一种概率型的全局最优搜索方法,它能高效且有效地完成某些优化和控制的复
随着互联网与多媒体技术的普及,数字产品的存储、复制和传播越来越便捷,但同时多媒体数据的安全性也遭受着越来越多的威胁。输入输出设备的发展和高精度产品的出现使得伪造更
随着网络技术和多媒体技术的飞速发展,多媒体信息逐渐成为人们获取信息的重要手段。世界范围内的信息交互已经成为可能,各种信息源(文本、图像、声音等)的数字化使信息复制更