面向嵌入式计算的语音识别技术的实验研究

被引量 : 8次 | 上传用户:onlymiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术经过几十年的探索和研究,已经取得了一系列突破性的进展,一些成熟技术正逐渐应用于实际生活中。近年来,作为一种方便的人机交互手段,语音识别在消费类电子产品和工业控制等领域迅速发展,有着广泛的应用前景。嵌入式平台上的基于隐马尔可夫模型的非特定人、小词汇量、孤立词语音识别技术正在成为目前研究的热点之一。本文系统地研究了组成小词汇量语音识别系统的各种关键技术,在Matlab实验平台下完成语音训练和识别算法的设计,取得相关实验数据,为软硬件协同实现语音识别提供依据,并在此基础上探讨了其在FPGA上的实现问题。语音识别的理论模型对系统的构建具有指导意义,本文首先分析了语音信号的声学模型和汉语音节特点,合理地选择了音节作为语音识别的基本单元。然后详细地论述了语音识别的流程和基于Matlab的软件实验平台,并应用隐马尔可夫模型实现孤立词语音识别。隐马尔可夫模型对时间序列具有很强的建模能力,通过对时间序列特征参数的训练,为每个语音建立一个隐马尔可夫模型。待识别语音通过与各个隐马尔可夫模型匹配,即得到识别结果。它是一个鲁棒性模型,可以确保识别的高正确率,因此,广泛应用于语音识别领域。论文在Matlab实验平台上编写和仿真了预处理、端点检测、特征参数提取、矢量量化、隐马尔可夫模型训练和识别几个子功能模块,实现了语音识别的整体过程。并用汉语数字识别验证了方案的可行。同时,在对经典方法深入研究的前提下,本文还探讨将动态窗长、模糊理论等引入语音识别过程,通过对小词汇量孤立词的语音识别实验,取得了一定的效果。文章最后采用Matlab、VC++、FPGA,建立了一个软硬件协同语音识别的实验研究平台,探讨了语音识别算法在FPGA上的应用,重点考虑了基于帧的流程决策、MFCC定点计算和Viterbi算法等几个问题。结合FPGA结构特点,直接使用加法器、乘法器、比较器等建立一个Viterbi算法结构,采用改进的方法计算Viterbi得分和预计算逻辑实现了一种简单的基于隐马尔可夫模型的语音模板匹配。实验证明了该方案的切实可行。
其他文献
<正>中国商务部援疆项目—喀什、乌鲁木齐、伊宁、奎屯、霍尔果斯五个城市(口岸)商贸物流中心建设规划于2012年9月19~21日,在商务部组织的国家级评审中获得通过。商务部贸易研
<正>失眠是指睡眠时间或质量不足的一种病症,其临床表现以睡眠改变为主,包括入睡困难、睡眠时间短、甚则彻夜不寐,或睡眠不实、醒后难以再睡,或睡眠质量下降、睡时多梦,常伴
<正>近30年来,随着感染性疾病的控制和工业化社会的发展,过敏性疾病的患病率在全球范围内迅速攀升,并已成为儿童最常见的疾病[1]。国家级名老中医、中西医结合儿科专家温振英
<正> 东方式插花通常指以中国和日本为代表的插花,它与西欧式插花最明显的区别在于:用花量不太大,且讲究花叶的巧妙配合,轻描淡抹,清雅脱俗。东方式规则型插花通常由三个主枝
苔藓为低矮的地被植物,种类繁多,是盆景制作中布翠的最优材料。苔藓植物多生活于潮湿环境,除了在冬春寒冷季节之外,野外低洼潮湿的地方均可见到。盆景制作中树木盆景的盆面处理和
波导缝隙阵列天线由于结构紧凑,辐射效率高,可靠性好,重量轻而广泛应用于雷达和通信中。本文提出一种应用印刷工艺的新型超薄波导缝隙阵,此种天线结构既有波导缝隙天线固有的
<正>日前,美国宣伟涂料公司(Sherwin-Williams)船舶与防护涂料业务部推出了一种新型高性能脂肪族Aqu Armor WBU水性聚氨酯地坪涂料,它具有独特的耐热轮胎污染性能和耐化学品
第一部分1α,25-二羟维生素D3对黑素细胞增殖及黑素合成影响的研究目的:探讨1α,25-二羟维生素D3对黑素细胞增殖及黑素合成的影响。方法:用环切法取正常人包皮,于体外培养黑素细胞
<正>吉俄联合组建国家物资储备【吉尔吉斯斯坦《比什凯克晚报》】独联体国家国家物资储备机关负责人协商委员会第11次会议商定,在亚美尼亚、吉尔吉斯斯坦、塔吉克斯坦分别组
<正>2013年,吉尔吉斯斯坦政府出台诸如"2013~2017年吉尔吉斯斯坦稳定发展战略"等一系列调整经济的政策;加之被喻为吉尔吉斯斯坦"国民经济发动机"的库姆托尔金矿2013全年产量同