粒子群神经网络在语音识别中的研究与应有

来源 :南开大学 | 被引量 : 0次 | 上传用户:wangjiejin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别和人工神经网络模型长期以来都是学术界研究的重点,前者是方便计算机和人类交互的一种手段;后者使用数学方法对于人脑工作机制进行抽象和建模。本文将二者结合,使用人工神经网络作为语音识别系统的识别模块,在VC.NET环境下设计并实现了一个由C++语言开发的汉语非特定人孤立词识别系统。   语音识别系统包括五个主要部分,预处理、语音增强、端点检测、特征参数提取以及训练和识别。系统中前四部分主要涉及语音信号处理的内容,本文所实现的语音识别系统在语音增强和端点检测模块分别采用基于LPC全极点模型的语音增强算法及基于改进的能量谱熵的语音信号端点检测算法完成。在特征参数提取模块分别提取了LPCC参数和MFCC参数。识别系统的训练模块采用了具有良好的容错能力和分类能力、并行处理能力和自学习能力的人工神经网络模型。同时为了克服神经网络训练算法存在的易陷入局部极小值和收敛速度慢等缺点,本文采用基本粒子群算法和三种改进的粒子群算法对神经网络的训练过程进行优化。   在对语音识别相关问题和粒子群神经网络进行深入研究的基础上,本文使用C++语言搭建了针对非特定人的孤立词语音识别系统,并设计和采集语料库进行必要的训练和实验;对于BP神经网络和粒子群神经网络在识别系统中的性能进行相应比较,得到实验结论。实验结论表明:粒子群神经网络作为识别模型能有效地优化神经网络,加快收敛速度,避免出现“早熟”现象,大大提高了神经网络训练精度和系统识别率。   最后本文对遇到的一些问题进行了总结和分析,对需要改进和添加的功能进行了必要地补充,以便以后的研究者对系统不足的地方进一步地完善。
其他文献
随着关系数据库技术的不断发展,越来越多不同领域的信息以结构化数据形式存储在关系数据库中,关系数据库已成为当今数据库的主流形式。然而,随着关系数据库的不断普及,其查询方式
随着计算机技术、多媒体技术和互联网技术的飞速发展,数字多媒体信息的复制与传播也变得非常方便。作为网络上主流的多媒体产品,数字图像可以使用如PS等图像处理工具进行任意
使用电子纸作为显示屏的手持类纸阅读器具有功耗低、重量轻、静态显示等特点,在阅读舒适性方面有显著优势。随着无线网络的迅猛发展,越来越多手持类纸阅读器具备了无线网络功能
目前网络流量管理中大多都是依据基本的流量统计数据进行,没有对这些数据进一步的分析处理。本论文尝试从流量的公平合理性角度研究网络流量行为,对网络流量的公平性评估进行
配电变压器是电力传输过程中的枢纽设备,其运行状态对整个配电网络影响重大。若能尽早发现变压器运行中存在的故障,合理安排检修、调试等维护性手段,可以有效延长设备使用年限,增大设备利用率,减少配电故障损失。使用油中溶解气体分析技术的变压器远程监测系统可以在不断电的情况下远程监测变压器状态,同时具备可连续监测、抗电磁干扰等诸多特点,在监测和诊断故障方面具有明显优势,而故障诊断方法正是该类系统中的核心。本文
近年来,由人类信息处理机制发展的智能计算模型是人工智能领域中最热门的研究课题之一。人体中有三个重要的控制系统,分别为神经系统、免疫系统和内分泌系统。内分泌系统中蕴
无线传感器网络是由大量的微小节点通过无线通信技术组成的资源受限的自组织网络。无线传感器网络集数据的采集、传输、分析于一体,是信息技术的一个新领域。网格技术利用计算
目前,原子力显微镜(Atomic Force Microscope,AFM)作为一种针对纳米级样品的成像与操作工具,已被广泛应用于生物、医学、材料等工业领域之中。原子力显微镜虽然具有非常高的成像
嵌入式系统的功耗随着芯片密度、性能要求的大幅增加呈指数增长,以电池供电的便携式设备的能耗问题尤为突出,随之而来的芯片散热成本增加、芯片稳定性下降等问题严重制约了嵌
随着企业信息化进程的推进和技术的不断革新,激烈的竞争和日益复杂多变的市场环境,让企业面临的不确定因素急剧增加,向企业的生存和发展提出了严峻的挑战。企业是一个复杂的系统