论文部分内容阅读
语音识别即语音信号处理是当今信息科学研究领域中的一个重要分支,它是将数字信号处理与语音学相结合,解决现代通信领域中人与人之间、人与机器之间的信息交换问题。 让人与计算机自由地交谈,机器能听懂人讲话,是语音识别技术最终将实现的目标。进入九十年代,语音识别方面的研究进一步升温,出现了诸多实用化的研究方向。作为语音识别和应用的前期步骤和首要条件很早就受到人们的关注。随着计算机应用的普及、性能的提高以及语音识别和实时音频流领域的研究逐步成熟,语音的应用越来越成为现实,因此对语音分割的研究也正在受到越来越多的重视。 本文首先归纳和分析了当前语音检测的典型算法,通过综合比较,然后提出了一个基于能量的应用于教学系统的实时音频流分割的算法,首先对语音进行滤波除噪的预处理,然后利用语音的能量特征进行分割,最后利用有限自动机进行多模式控制。本系统具有实时性好,准确性高等特点,并且投入实际应用后,已经取得了很好的使用效果。 本文对各级操作都给出了简单实用的算法,在Microsoft Windows 2000平台上visual c++6.0开发环境下,采用上述算法编制了语音分割和多模式控制的软件。一共使用了10段,大约六十多分钟的英语听力材料进行实验,并利用实验结果对程序的一些参数做相应的调整。实验证明软件能够对音频流进行正确实时检测和相应的控制。