论文部分内容阅读
语音识别是人机交互技术的基础,是语音信号处理的一个重要方面,有着广阔的应用前景,对语音识别进行研究具有重要的理论价值和实际意义。语音识别是典型的多类分类问题,由于支持向量分类机(SVM)善于解决高维分类问题,可以用来处理语音识别问题。本文首先系统地介绍了语音识别的基本原理,分析了目前主要的语音识别方法的局限性和不足,概述了本文研究的基础——统计学习理论和支持向量机方法,这些方法基于统计学习理论和贝叶斯参数估计理论。算法的训练过程本质上是求解一个二次凸优化问题,不存在局部极值问题,从而避免使学习过程复杂化。这一方法有许多好处,例如,该模型构造了一个关于数据的最明确的信息依赖模式(即支持向量),这对算法完成分类有明确的意义。本文分别构建了基于“一对一”、“一对余”、“有向无环图”三种多类分类方法的支持向量机非特定人语音识别系统,分析了三种算法各自的优缺点,并进行了大量的仿真实验。实验结果表明,三种支持向量机应用于语音识别系统中均取得了优于隐马尔可夫模型的识别结果,并且算法的运行速度也优于隐马尔可夫模型。其次,研究了在相同的核函数下,惩罚参数和核参数对支持向量机泛化性能的影响,分别选取不同的惩罚参数值和核参数值进行语音识别实验。实验结果表明,惩罚参数和核参数会对支持向量机的泛化性能带来明显影响,从而影响语音识别系统的识别效果。为了满足语音识别系统对实时性和便携性的要求,本文提出了一种基于MFCC/SVM在OMAP5912嵌入式系统开发平台上的实现方法,实现了一个面向非特定人的语音识别系统。和传统的基于特定人的语音识别系统相比,该系统易于使用,语音识别更为快速便捷,并且具有一定的通用性。