多类分类支持向量机在语音识别中的应用研究

来源 :太原理工大学 | 被引量 : 29次 | 上传用户:seelo1332
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是人机交互技术的基础,是语音信号处理的一个重要方面,有着广阔的应用前景,对语音识别进行研究具有重要的理论价值和实际意义。语音识别是典型的多类分类问题,由于支持向量分类机(SVM)善于解决高维分类问题,可以用来处理语音识别问题。本文首先系统地介绍了语音识别的基本原理,分析了目前主要的语音识别方法的局限性和不足,概述了本文研究的基础——统计学习理论和支持向量机方法,这些方法基于统计学习理论和贝叶斯参数估计理论。算法的训练过程本质上是求解一个二次凸优化问题,不存在局部极值问题,从而避免使学习过程复杂化。这一方法有许多好处,例如,该模型构造了一个关于数据的最明确的信息依赖模式(即支持向量),这对算法完成分类有明确的意义。本文分别构建了基于“一对一”、“一对余”、“有向无环图”三种多类分类方法的支持向量机非特定人语音识别系统,分析了三种算法各自的优缺点,并进行了大量的仿真实验。实验结果表明,三种支持向量机应用于语音识别系统中均取得了优于隐马尔可夫模型的识别结果,并且算法的运行速度也优于隐马尔可夫模型。其次,研究了在相同的核函数下,惩罚参数和核参数对支持向量机泛化性能的影响,分别选取不同的惩罚参数值和核参数值进行语音识别实验。实验结果表明,惩罚参数和核参数会对支持向量机的泛化性能带来明显影响,从而影响语音识别系统的识别效果。为了满足语音识别系统对实时性和便携性的要求,本文提出了一种基于MFCC/SVM在OMAP5912嵌入式系统开发平台上的实现方法,实现了一个面向非特定人的语音识别系统。和传统的基于特定人的语音识别系统相比,该系统易于使用,语音识别更为快速便捷,并且具有一定的通用性。
其他文献
随着蜂窝移动网络、短距离无线网络等无线接入网的广泛使用,下一代的无线网络必将是多种无线接入方式并存的异构网络。作为异构网络中的关键技术,垂直切换的实现复杂于同构网
学位
远程的数据采集与传输系统在许多工业场合,尤其是一些分散、无人值守的场合,需要对现场的设备进行实时地采集或控制,传统的无线或者有线系统往往需要投入大量的时间、资金等
相控阵天线波束的捷变能力,使得相控阵雷达在工作时具有极强的灵活性。在雷达控制器的作用下,相控阵雷达能够自适应地调整工作参数,并在搜索、跟踪等多种工作方式之间进行切
图像信号的采集和处理在科学研究、工农业生产、医疗卫生、公共安全等领域得到了越来越广泛的应用,而这些工作都需要一套高速的图像系统来完成。尤其是近些年来,信息化的高速
Internet在全球异构网络互连上取得了巨大的成功。随着科学技术的发展和各领域研究的不断深入,各种新型的网络开始出现,例如陆地移动网络、军事无线自组织网络、星际网络及无