语音信号前端处理技术研究

被引量 : 0次 | 上传用户:ldlhongerfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了低信噪比下的语音端点检测和语音增强。端点检测和语音增强都是语音信号的前端处理,其准确性在很大程度上影响了后续语音处理如语音编码和语音识别的效果。有效的端点检测不仅能使处理时间减到最少,而且能排除无声段的噪声干扰。语音增强则从含噪信号中提取干净的语音信号,提高语音信号的信噪比。 关于低信噪比下的语音端点检测和语音增强,本文的主要工作如下: 1.研究了基于短时能量和短时平均过零率的端点检测方法,对能量阈值的设定提出了改进,利用无声段能量的平均值代替了最小值,并着重探讨了此方法在不同噪声环境下的检测效果。 2.研究了基于频带方差的端点检测法,利用语音段和噪声段频谱特性的差异来检测语音的起始和结束点,并在实现过程中剔除了无声段中某些帧的频带方差的突变,避免了因话筒震动等原因引起的脉冲干扰。 3.研究了基于短时信息熵的端点检测方法,利用语音段信息熵高于无声段的特点,进行语音起始点和结束点的判定,并讨论了实现过程中门限阈值的设定和剔除无声段中某些帧的熵值突变的问题。 4.利用以上三种方法,对20个数字和字母的汉语发音以及一些汉语短句,测试了它们在纯净语音、加不同信噪比白噪声和Babble噪声情况下的检测效果。结果表明,在安静环境下,短时能量过零率法和信息熵方法的检测结果比频带方差法准确;但在噪声较大的情况下,频带方差法特别是信息熵法的检测效果要远远优于短时能量和过零率法。 5.针对谱相减方法中忽略了含噪信号随时间的变化和在不同频段下的噪声对语音信号影响的问题,提出了两种改进算法:对每一帧含噪信号根据其噪声平稳度的不同动态调整谱相减算法的系数;以及根据每一帧语音信号的听觉掩蔽阈值动态调整各个关键频段的谱相减参数,从而更加准确的逼近实际噪声,使谱相减之后的结果更趋近纯净语音信号。与常用谱相减算法的对比实验证明,改进算法能有效消除音乐噪声,在很大程度上提高了信噪比。相比之下,基于听觉掩蔽模型的谱相减算法以人耳的听觉系统特性作为研究的基础,其增强结果在可懂度上也有了一定的提高,这为解决信噪比与可懂度的矛盾提供了一种新思路。
其他文献
<正>为贯彻落实党的十八大和全国人才工作座谈会精神,以人才管理改革试验区建设推动人才发展体制机制改革和政策创新,形成具有国际竞争力的人才制度优势,中国人事科学研究院
<正>从外因来看,人才政策创新是赢得全球人才竞争、适应国内发展环境转变的需要;从内因来看,人才政策创新是适应人才的战略性地位、适应人才需求变动和人才问题变迁、突破人
目的观察复方丹参片联合曲美他嗪治疗冠心病不稳定型心绞痛的临床疗效。方法 60例不稳定型心绞痛患者随机分为对照组和治疗组,观察治疗后患者心绞痛发作情况、心电图变化以及
随着我国社会主义市场经济的发展和加入WTO,畜牧业生产在保障供给的基础上,已经向质量、安全和环保的更高要求发展。动物疫病控制和畜产品安全管理工作的地位越来越显重要,兽
目的了解目前社会上的心理咨询机构发展现状及咨询人员对心理咨询市场的看法。方法采用半结构化访谈,逐一走访15家社会心理咨询机构,以频数统计和类属分析的方式分析访谈资料
随着我国与越南贸易额逐年增加,植物及植物产品的调运越来越频繁,云南省红河州边境口岸由越南进境的植物产品中截获到大量有害生物。本文对2014—2016年红河州边境口岸截获有
十九大报告中提出要实施乡村振兴战略,产镇融合符合现阶段我国乡村振兴的实际需求。文章通过对银川市西夏区郊区乡镇兴泾镇城镇化与产业融合规划的可行性研究,从研究意义、研
<正>唐朝是中国封建社会少有的盛世,无论经济、政治、文化都取得了前所未有的发展,尤其是政治制度、法律制度得到了成熟和定性,其影响深远而广被。其中,监察法制在汉、魏晋的
会议
目的了解高中生心理健康状况及其影响因素,为高中生心理辅导提供依据。方法采用SCL-90量表评定了198名高中生的心理健康状况,运用胡胜利调查出的影响高中生心理健康的26项原
戴尔·卡耐基是美国成人教育运动的先驱。他一生积极地从事成人教育实践活动,积累了丰富的成人教育思想及实践经验,他独创的成人教育方式改变了世界数亿计成人男女的生活和事