农产品市场信息采集的语音识别鲁棒性方法研究

来源 :中国农业科学院 | 被引量 : 0次 | 上传用户:luckyhelen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前语音识别的研究已取得了较为丰硕的成果,在安静环境下性能令人满意,逐渐被应用在诸多人机交互的场合。然而,由于噪声的存在,语音识别系统在实际环境下性能急剧下降,如何提高语音识别的噪声鲁棒性,逐渐成为近年来语音识别的研究热点。本文主要研究农产品市场信息采集作业环境中的语音识别噪声鲁棒性问题,针对当前缺乏面向农产品市场信息采集领域的语音识别引擎,而通用领域的识别算法又不适合解决上述问题,分析环境的噪声特点,面向非特定人和中小规模词汇量的连续汉语普通话识别,训练声学模型,研究适用于该环境下的语音识别鲁棒性方法。本文主要研究的内容包括:(1)基于隐马尔科夫模型(HMM)框架建立了声学模型,利用自建的农产品市场信息语料库进行训练和测试HHM模型,基于HTK工具包建立了农产品价格语音识别基线系统。(2)在分析农产品市场信息采集环境的噪声特点的基础上,从模型空间和特征空间对系统采取了多种鲁棒性方法,包括:在声学模型的识别基元选取上,采用了一种扩展的三音素声韵母模型,有效的解决了音节内部和音节间的协同发音问题,大大提高了识别率;针对建模后三音子模型数量急剧增加问题,采用了决策树状态聚类方法,建立了一套二值问题规则集,并将语音学的专业知识融合进决策树,通过聚类减少了三音子模型的数量,有效地解决了训练数据不充分问题;鉴于倒谱均值归一化(CMN)方法在消除信道卷积噪声以及加性噪声方面的良好表现,在农产品市场信息语音识别系统中采用,有效缓解了信道噪声影响。(3)在信号空间,为了提高输入语音信号的信噪比,采用了谱减类算法进行语音增强,但谱减算法容易带来信道失真和“音乐”噪声。为了减少这种失真,提出了一种联合语音增强与特征补偿的鲁棒性方法,把倒谱均值方差归一化方法(CMVN)与谱减类算法进行了结合,二者互为补充。实验结果表明,联合后的算法能有效提高系统的识别率,特别是在低信噪比时效果更为明显。(4)在统计估计理论的框架下,研究了估计幅度与实际幅度的最小均方误差(MMSE)估计器以及对数最小均方误差(log MMSE)幅度估计器。在此基础上提出了一种联合MMSE以及log MMSE幅度估计与CMVN失真补偿的鲁棒性方法。不同农产品市场信息采集环境下的实验证明,该方法具有一定的噪声鲁棒性,多种空间算法的有机结合可以提供系统的鲁棒性,特别是在低信噪比时更为明显。本文的研究为语音识别在农产品市场信息采集环境中的应用建立了一套鲁棒性方法,为今后语音识别在农业信息采集领域的应用提供了借鉴。
其他文献
对DDoS攻击中傀儡机的管理进行研究,提出了DDoS攻击的傀儡机动态分布策略,该策略根据实际需要可以定时随机改变傀儡机在僵尸网络中的层次位置,也可以根据傀儡机配置信息以及
本文介绍了新疆乌鲁木齐县水西沟镇某度假型酒店的暖通空调设计,包括设计参数、采暖空调冷热源、水系统、通风系统、防排烟系统和自控的设计。
县域经济是整个社会经济的重要组成部分,在全国经济社会发展中具有举足轻重的作用,但长期以来,我国县域经济特别是欠发达地区县域经济发展过程中存在着一系列问题。本文针对
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本文通过对2007年武汉市企业社会责任现状调研的结果进行科学分析,得出反映武汉市企业社会责任现状的结论,并提出发展建议,以期望对武汉市企业社会责任发展以及“两型社会”
以分组交换为基础的Internet已经成为通信网络的重要组成部分。随着光纤通信技术以及光传送网络的快速发展,Internet中现有路由器、交换机等网络设备的容量及可扩展性已无法
目的研制低密度脂蛋白胆固醇(LDL-C)表面活性剂直接消除法测定试剂。方法低密度脂蛋白(LDL)与试剂Ⅰ中的表面活性剂Ⅰ形成稳定复合物,而非LDL中胆固醇被胆固醇酶、过氧化物酶
审计工作是我们经济社会中十分重要的组成部分,由于其重要作用和行业工作的特殊性,在实际的操作过程中极有可能因出现失误,从而造成审计风险的出现,为了能够避免这样的情况,避免在