论文部分内容阅读
语音识别和人工神经网络模型长期以来都是学术界研究的重点,前者是方便计算机和人类交互的一种手段;后者使用数学方法对于人脑工作机制进行抽象和建模。本文将二者结合,使用人工神经网络作为语音识别系统的识别模块,在VC.NET环境下设计并实现了一个由C++语言开发的汉语非特定人孤立词识别系统。
语音识别系统包括五个主要部分,预处理、语音增强、端点检测、特征参数提取以及训练和识别。系统中前四部分主要涉及语音信号处理的内容,本文所实现的语音识别系统在语音增强和端点检测模块分别采用基于LPC全极点模型的语音增强算法及基于改进的能量谱熵的语音信号端点检测算法完成。在特征参数提取模块分别提取了LPCC参数和MFCC参数。识别系统的训练模块采用了具有良好的容错能力和分类能力、并行处理能力和自学习能力的人工神经网络模型。同时为了克服神经网络训练算法存在的易陷入局部极小值和收敛速度慢等缺点,本文采用基本粒子群算法和三种改进的粒子群算法对神经网络的训练过程进行优化。
在对语音识别相关问题和粒子群神经网络进行深入研究的基础上,本文使用C++语言搭建了针对非特定人的孤立词语音识别系统,并设计和采集语料库进行必要的训练和实验;对于BP神经网络和粒子群神经网络在识别系统中的性能进行相应比较,得到实验结论。实验结论表明:粒子群神经网络作为识别模型能有效地优化神经网络,加快收敛速度,避免出现“早熟”现象,大大提高了神经网络训练精度和系统识别率。
最后本文对遇到的一些问题进行了总结和分析,对需要改进和添加的功能进行了必要地补充,以便以后的研究者对系统不足的地方进一步地完善。