嘈杂环境下特定目标语音搜索方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:aa5518505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音搜索是用来判定特定目标身份信息的一种识别技术,应用领域较为广泛,所以嘈杂环境下特定目标语音搜索方法成为当前研究的热点,具有重要的理论和实际意义。本文从语音信号的基本理论入手,着重研究了特征参数的提取、高斯混合模型的训练方式、噪声参数估计及语音增强算法,并提出了一种基于语音增强算法与高斯混合模型相结合的嘈杂环境下语音搜索方法。本文对语音搜索的逐个环节进行了详细研究,首先对语音信号的预处理过程进行了简要分析,研究了几种常用的端点检测方法,指出了其在嘈杂环境下的不足。其次分析了几种典型特征参数的提取方法,并对梅尔倒谱系数进行一阶差分处理得到ΔMFCC,将MFCC与ΔMFCC相融合,以提高系统搜索的准确性。然后对嘈杂环境中的噪声特性进行了研究,主要分析了有声/无声段检测与连续噪声谱两种噪声估计的方法,并将改进的谱熵法用于有声/无声段检测。经仿真实验表明,有声/无声段检测仅能对平稳噪声进行有效估计,而连续噪声谱对平稳噪声和非平稳噪声均有较好的处理效果。在噪声估计的基础上,为了提高语音信号的信噪比,减少信号失真。对谱减法,维纳滤波算法,基于最小均方误差的MMSE算法进行了研究,并提出了新的动态Dynamic-MMSE算法。经仿真实验表明,本文提出的新算法较上述算法性能上有了一定提升。为了提高特定目标语音搜索的识别率,对诸多识别模型进行了研究。最终确定采用高斯混合模型及期望最大化算法(EM算法)将融合后的特征参数进行特定目标语音搜索,优势在于并不需要完整的数据便可对概率模型的特征参数进行最优估计,对于嘈杂环境下的语音搜索尤为适用。经一系列仿真实验表明,将梅尔倒谱系数与ΔMFCC融合后的特征参数能更好的反映特定目标的个性信息,经噪声参数估计和语音增强后,能将语音信号从带噪语音信号中较好的分离出来,将融合后的特征参数,经高斯混合模型训练识别后,在嘈杂环境下,特定目标的识别率有了明显提升。
其他文献
煤炭是我国的一种战略性能源,然而近几年,随着我国经济发展速度放缓,煤炭行业进入低谷期,整个行业面临着调整与革新。山西煤炭业作为行业中的一员,面临市场的压力,不得不由对
中国特色哲学话语体系构建不仅需要在学理性上具备哲学话语体系构建的一般性特征,而且应当在哲学的话语概念、论说主题和立场等方面具有中国本土特色,融合传统与现实、贯通民
随着我国经济的不断发展,大气污染呈现日益严重的趋势,治理大气污染也成为我国亟待解决的现实问题。由于大气污染呈现的区域性复合型特征,仅依靠单一政府已经无法根本解决区
该文为更好落实APCD工作法,以专销协同为契机,以市场监管网格化为模本,将其构建为一个统一的整体,旨在通过构建专卖管理圈、AB岗位轮换延伸、推广模拟演练等手段更好的完善AP
目的探讨乌司他丁联合连续性血液净化治疗重症急性胰腺炎的临床疗效。方法选择2015年1月~2016年12月在我院诊断治疗的重症急性胰腺炎患者60例的临床资料进行回顾性分析。其中3
5G作为新兴的移动通信系统,目前已经成为了全球的研究热点。Massive MIMO作为5G中的关键技术之一,具有高频谱效率、高信道容量的优势,但目前关于该系统的研究尚不充分。对此,
文化产业目前已成为人们精神消费的主要供应源,只有通过和借助于文化产业这一具体载体,主流意识形态的有效传播才能得以实现。当前的文化体制改革促进了文化产业的发展,但也
随着时代的变化,人们生活的节奏越来越快,压力也越来越大,笔者通过对日常生活和自我的剖析,构思创作了系列油画《镜》来阐述自己对人与世界之间关系的看法。在研究生学习期间
目的:探讨肺癌患者外周血MMP-7mRNA、hTERT的表达与血清CEA联合CA19-9、CYFRA211、SCC、NSE和ProGRP蛋白检测的临床意义,及其三种结果之间灵敏度的比较;在以后的随访当中,得出MM
在新环境新形势下,民营经济面临着难得的发展机遇,同时也面临着挑战性问题。本文对当前制约聊城市民营经济、中小企业发展的突出问题作了系统总结,对聊城市民营经济、中小企