论文部分内容阅读
随着各式机器在生产和生活中发挥着重要作用,因此改善人与机器的关系就显得尤为重要。语音识别作为一种具备良好体验的人机交互媒介,对其展开的研究具有重要的实际意义。文中介绍了语音识别理论和技术发展过程,对其主要方法作了较详细的论述和分析,特别对近年来呈现出主流发展方向的隐马尔科夫模型(HMM)方法作了较深入的讨论,并在此基础上提出了基于HMM的汉语孤立词语音识别系统的设计方案。同时,编程实现了一个小词汇量非特定人孤立词语音识别系统。论文主要完成以下的工作:(1)介绍了语音识别系统中涉及的相关概念与方法,在端点检测中引入了功率谱熵与短时平均幅度相结合的方法,采用MFCC作为特征参数并添加动态差分参数形成一个39维的特征矢量。(2)详细介绍了HMM的基本思想以及它在语音识别系统中的应用,并给出其中涉及的主要算法公式详细推导。在此基础上,分别对HMM的两个模型(DHMM和CHMM)的训练做出了详细的描述,包括参数值的选择与设定。并且对模型的训练作了一些改进,来减少训练时间。(3)采用C语言编写了基于Widows系统的非特定人孤立词识别系统软件,并建立了一个包括10个词汇的语音文件与信息的语音数据库。(4)对所设计的语音识别系统进行了训练与测试,验证了本文所提出的非特定人孤立词识别方法的有效性,明确了进一步的改进方向。