基于信息熵的语音端点检测改进算法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:thisxyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音端点检测是语音识别、语音编码等语音分析系统中一个重要的环节,其准确性在某种程度上直接决定了整个语音数字信号处理系统的成败。在实际运用中,通常要求首先对系统的输入信号进行判断,准确的找出语音信号的起始点和终止点。这样才能采集到真正的语音数据,减少数据量和运算量,并减少处理时间。目前,现有的端点检测算法对信噪比很高的语音端点检测效果很好,且这些算法简单实用,但当有背景噪声时,其性能都有很大程度的下降,有的因此而失效,因为研究抗噪声语音端点检测算法意义重大。 本文首先简单介绍了语音产生机制,语音信号的采集和数字化、加窗分帧和时域、频域等处理方法。然后对近几年国内外研究学者提出的语音端点检测算法和语音增强算法进行了对比仿真研究,分析了现在常用算法的优缺点,为抗噪声语音端点检测算法的改进提供理论基础。在比较研究目前常用的语音识别端点检测算法后,深入研究信息熵函数,信息熵函数在无背景噪声情况下,能够很好的区分语音段和非语音段,由于其受语音的能量影响小且具备一定的鲁棒性,所以这一特征在近几年备受研究人员的青睐特征,在此基础上提出了基于信息谱熵的改进抗噪声端点检测算法: (1) 在基于信息谱熵语音端点检测的基础上,结合谱减法在高斯噪声降噪方面的优越特性,提出了结合谱减法增强的信息谱熵端点检测改进算法(IABSE)。该算法既克服了谱减法往往是利用固定的无音片段来对背景噪声进行估计容易产生误差的缺点又消除了高斯噪声对语音与非语音信息熵特征的区分性的影响。仿真实验表明,该改进算法对高斯背景噪声具有很好的鲁棒性。 (2) 由于谱减法对加性高斯噪声往往能起到明显的效果,但对非高斯噪声没什么效果,而语音和噪声存在统计特性的差别,运用独立分量分析(ICA)可以有效区分语音和噪声。本文结合ICA降噪和改进子带谱熵提出新的端点检测算法(ICASE),以改善在多种背景噪声下的端点检测算法的鲁棒性。实验结果表明,该算法对加性非高斯背景噪声具有很好的鲁棒性。
其他文献
在现代自动化生产过程中,机器视觉被广泛地应用于产品装卸、分拣和质量检测等领域。在一些人工视觉难以满足要求的情况下或不适合人工作业的恶劣工作环境中,常用机器视觉来代替
多时滞切换系统是一类新型的复杂系统,有着广泛的实际背景和理论研究意义。这类系统的连续动态、离散动态与时滞相互作用,使系统的动态行为变得十分复杂。系统运行机制还未清
随着电子芯片主频不断提高及其组装尺寸的逐步小型化,以及多芯片高密度组装和多核芯片的发展趋势,芯片工作产生的巨大热量已成为制约电子设备热可靠性提高的瓶颈。因此,研究
涡街流量计是上世纪60年代末期发展起来的一种流量计,它利用流体振动原理来进行流量测量,具有仪表内无机械可动部件、介质适应性宽、压力损失小以及输出频率脉冲信号等优点,
远程控制实验室系统,是基于飞速发展的Internet网络,利用计算机自动控制技术、网络通信技术、仿真技术、多媒体技术、网络数据库技术以及Web技术等组成的网上远程高级控制系统,
随着计算机技术、自动检测和传感技术、自动控制技术以及网络技术的发展,测量的直观、准确、智能化和控制的可靠及其过程自动化与信息管理自动化无疑己成为商品水泥搅拌站的
张力控制是钢铁工业应用非常广泛的一项技术,它实现的好坏直接关系到产品的生产效率的高低和质量的优劣。近些年来,随着人们对产品质量要求的进一步提高,张力控制越来越引起
无线传感器网络是由大量无处不在的、具有通信与计算能力的微小传感器节点构成的智能自治测控网络系统,实时监测、感知和采集监测对象信息,数据处理后传送至终端用户,可广泛
随着移动机器人学及其应用技术的不断发展,单个机器人的有限能力已不能满足完成复杂任务的要求,因而多机器人协作技术成为当前该领域的研究热点之一。多机器人协作定位是提高多
在实际工程中存在着大量的非线性系统,所以对非线性系统的研究有着非常重要的意义,非线性系统的建模预报是其应用的一个重要方面。船舶运动预报就是根据历史数据的特点,估计