基于神经网络的语音识别鲁棒性研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:xiaowangjianfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术已经取得令人鼓舞的成就,市场上也出现了许多相对成熟的语音识别产品,但是大部分语音识别系统仍局限于特定的环境,距离真正的实用化还相差很远。本文以提高语音识别系统的鲁棒性为目标,进行了相关的实验和研究。本文主要内容为语音信号处理,包括特征提取分析和模式识别,介绍国内外这一领域的研究成果和进展,针对其中的问题提出自己的解决方法和思想,并实现了一些相关的算法。第一章为引言,介绍论文研究的背景意义和国内外的研究现状。第二章为研究方法和技术的介绍,主要是神经网络基础知识。第三章为语音信号的特征提取和分析,介绍了各种常用的语音特征参数以及特征分析的方法与工具,给出特征提取过程中一些问题的解决方法和算法,第四章为神经网络识别部分,对语音识别中常用的几种神经网络模型进行了分析和比较。第五章是论文的总结。主要内容包含如下:语音识别的基本概念、发展历史和现状。人工神经网络的主要原理和概念以及在语音识别中的应用。语音识别系统一般由特征提取和模式识别这两个模块构成。特征提取阶段主要使用线性预测编码技术从语音信号中提取特征向量。采样和量化完成语音信号的数字化过程;语音特征分析分为时域分析和频域分析,时域分析常用的特征参数有短时平均能量和短时过零率,短时傅立叶分析、线性预测编码和倒谱分析则是三种常用的频域分析方法;语音信号特征提取中的端点检测问题以及检测方法的分析比较;提出清浊音检测问题的一种解决方法并在基于Matlab 的环境下实现了算法,实验分析算法的性能;分析汉语数字语音的基频和共振峰特征;讨论语音特征参数的噪声鲁棒性和语音信号的情感特征参数。神经网络应用于语音识别的模式识别阶段。首先是网络模型的训练和学习过程,调整好的网络模型就可以应用于识别了。多层感知机以及反向传播算法在语音识别中应用广泛;时间延迟神经网络可以很好地适应语音信号频谱参数的时变性,使用的训练算法也是反向传播算法;循环神经网络是一种既有前馈通路,又有反馈
其他文献
本文研究的是大连市国有企业青年科技人员工作满意度和绩效之间的关系。首先,通过对课题研究的理论基础和实践基础进行分析,阐明了笔者对工作满意度、工作绩效和二者之间关系的
本文提出城市交通物流基础设施的概念,并尝试以系统理论为方法论指导,来描述城市交通物流基础设施系统,用系统分析的一般原则和方法初步解决一些问题。本文将城市交通物流基础设
  本文总结出商业银行综合业务经营管理理论和相应的经营原则,即现代商业银行的三大主营业务是资产业务、负债业务和中间业务,商业银行要以做好资产负债业务为基础,大力开拓服
随着供应链管理思想在经济全球化的推动下取得了飞速发展,供应商和零售商之间的关系发生着巨大的变革。跨国公司的经营策略趋向于将现有的以赚取买卖差价为特征的传统零售商转
安全工作是工业企业生存与发展的基础,也是国家财产和人民群众生命健康安全的根本保障,随着社会的进步和企业生产经营的不断发展,安全生产面临许多新的形势,国家和社会各界对安全
CIPS(Computer Integrated Process System,即计算机集成过程系统)中各类信息在执行层中融合与贯通,流程工业企业各生产目标的实现,内部物流管理、生产成本控制等生产管理活
本文对知识产权流通中的信息披露问题进行了研究。文章通过对产权市场和知识产权交易的特点分析,以及同国外类似交易市场进行比较,指出我国当前条件下的知识产权交易中的信息披
用户体验是用户在使用或期望使用产品的反应和结果,是企业的宝贵资源。随着大数据和人工智能技术的发展,这些海量的用户体验数据很好地通过多个途径以图文和影音等形式保留了下