小词汇量非特定人的孤立词语音识别系统研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:xx63394965
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一门交叉学科,涉及数字信号处理、人工智能、计算机科学和数学模型等许多学科领域,它是目前发展最为迅速的信息研究领域之一。随着人们的需求以及嵌入式芯片和移动终端设备等技术的不断发展,使得语音识别系统,尤其是非特定人的孤立词语音识别系统,越来越多的应用到我们的日常生活中(比如手机的语音拨号,汽车上的语音导航等),为我们带来了极大的便利。本文针对小词汇量、非特定人的孤立词语音识别进行了深入研究,主要的工作包括:提出了一种基于短时平均幅度增量和短时平均过零率的语音端点检测方法,该方法利用语音的短时幅度的连续上升做出第一级判决,以短时平均过零率为特征做出第二级判决。实验结果表明,在信噪比理想的情况下,该方法准确,简单,可靠。研究了语音识别中的几种特征提取算法:基于人的发音模型的线性预测系数(LPC)、线性预测倒谱系数(LPCC)和基于人耳听觉特性的梅尔频率倒谱系数(MFCC),并且列出了几种提高梅尔频率倒谱系数性能的方法。针对孤立词语音识别,本文研究了动态时间规整(DTW)和隐马尔科夫模型(HMM)算法。对于DTW算法,介绍了动态规划(DP)技术和松弛端点的DTW算法。在介绍隐马尔科夫模型时,从其概念入手,介绍了它的三个基本问题及其解法和连续隐马尔科夫模型。在对语音识别技术深入研究的基础上,提出了一套构建小词汇量非特定人的孤立词语音识别系统的算法方案,并在Matlab环境中实现了对语音识别系统的仿真;详细介绍了在实现系统的过程中所遇到的问题和解决问题的方法,并在最后通过实验对系统的性能进行了验证。该语音识别系统主要包括:语音信号的预处理(其中包括:预加重,归一化,分帧加窗和本文提出的端点检测算法),改进的梅尔倒谱系数的特征提取算法和连续型的隐马尔科夫模型识别几个部分。
其他文献
MIMO技术能够在空间形成独立的并行子信道同时传输多路数据流,有效地提高系统的传输速率,在不增加系统带宽和改变系统功率的同时增加了频谱利用率。OFDM技术通过将频率选择性
智能监控技术是视频监控领域中一项重要的研究内容,本论文以汽车安全记录仪工程项目为背景,通过对现有研究成果的分析总结,构建了基于BF561智能监控系统硬件平台并实现了基于
无人机航迹规划是促进无人机发展的重要研究内容,而动态航迹规划则是一项航空飞行器具备智能导航功能的关键技术。随着军事科技的发展,无人机的飞行环境愈加复杂,传统的航迹
随着我国电力行业的迅猛发展,无论是在城市、农村还是在边远山区,都已经完成了低压配电网的构建。利用低压电力线作为信息的传输介质来完成信号传输,具有接入方便、无需布线
海洋环境噪声采集系统在海洋探测、海洋环境保护等领域有着非常重要的作用。本文基于环境噪声采集系统的研制,主要研究甚低频信号的模拟处理方法以及电磁干扰的基本原理,并进
无线传感器网络作为一种全新的信息获取技术,已经被广泛应用于环境监测、林火探测、基础设施检测、精准农业等相关领域。但由于传感器节点存在能量、存储空间受限等问题,这制