基于HMM与ANN混合模型语音识别系统的研究与实现

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:xiaosongs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的蓬勃发展,作为人机交互接口的语音识别技术也受到国际各界学者的广泛重视。目前商用的语音识别系统在室内高信噪比环境下已经取得了较高的识别率,但对于室外的环境,系统的识别率则表现不佳。本文通过探寻语音识别系统对噪声的自适应性以及引入马尔科夫和人工神经网络混合模型的方法,初步建立了一个较为完善的语音识别自适应模型,能够提高复杂环境下的语音识别率,增强语音识别系统的稳健性及自适应性。  本文主要做了如下工作:  1.针对倒谱距离语音端点检测算法存在的问题,通过计算每帧语音信号的短时信噪比,确立信噪比与门限阈值的关系,建立了一种自适应判决门限的双参数判决准则,能够精准的检测出语音端点信号,改进后的算法具有一定的自适应性,语音信号端点检测准确率有所提升。  2.针对谱减法语音增强技术容易产生音乐噪声的问题,引入了SNR与谱减因子关系模型,通过关系模型动态调整谱减因子及语音增益系数,在最大限度抑制音乐噪声产生的前提下,提升语音信噪比,增强系统的抗干扰能力和鲁棒性。  3.分析了马尔科夫模型和人工神经网络模型的优缺点,通过调整神经网络的连接权值、缩放系数和位移参数,提升了网络模型的收敛速率。  4.结合马尔科夫模型强大的时序建模能力和人工神经网络模型的分类功能,建立了一个马尔科夫模型与人工神经网络模型混合结构的语音识别系统,在低信噪比环境下,该系统依旧能够保持较高的语音识别率。
其他文献
随着数字成像技术的不断发展,如何高效率地分解、表示、提取图像信息成了计算机视觉中的研究热点。计算机视觉综合了图像处理、心理物理学、认知科学、神经生理学等多学科知
数字签名是目前电子商务中应用最广泛的一种电子签名方法,是实现安全电子交易的核心技术之一。数字签名提供身份认证、数据完整性、不可抵赖等安全服务,是保障网络信息安全的重
随着移动通信技术的快速发展以及人们对手机功能需求的不断提高,智能手机逐渐成为人们的日常消费品。双网双待技术是智能手机的主要技术之一,它解决了一部手机可以同时使用两种
在3GPP LTE的协议版本中,Release8是一个成熟和稳定的版本,因此LTE的各项产品都以该协议版本为基础开发。在产品实现过程中必然存在诸多的问题需要解决,本文基于FDD LTE基站系统
随着物联网产业的发展,可穿戴人体体征检测设备作为其中的一个重要分支已经被人们所关注。将可穿戴人体体征检测设备与射频识别技术相结合可以实现可定位的人体体征检测,射频识别(Radio Frequency Identification,RFID)是实现定位功能的关键技术,RFID系统所用到的电子标签通常是无源的,其供电电能来自感应电流,所以电子标签能够提供的功率较低。因此本文提出一种可与RFID标签相结
随着数字通信技术的发展,由于信道编码技术可以增加数据传输的稳定性和可靠性,其在无线通信领域得到了普遍应用,但同时也增加了分析和处理接收信息的复杂度。如果接收方能够对
车辆的爆发式增长和无处不在的信息需求将通信网络与交通网络紧密结合起来,车载通信网由此应运而生,并成为一个研究热点。车辆间的通信形成了一种自组织的、结构开放的车载自组
随着第三代移动通信系统的研究和正式商用,无线网络的发展也逐渐凸显出其优势。但是,3G时代的来临还并不能立马宣告2G时代的结束,无论是从网络服务质量的需求上或是现网用户数占
随着低密度奇偶校验码(Low Density Parity Check Code,LDPC)被重新发掘出它具有非常好的误码率性能以及编译码较简单的潜能之后,已经成为继Turbo码之后另一种纠错编码的关注重