论文部分内容阅读
说话人识别是语音处理技术的一个重要内容,它广泛应用于人机接口、保安、军事、司法等方面。本文研究与文本有关的说话人识别的方法,主要做了如下工作: (1)根据语音信号产生的离散时域模型,提取说话人识别的特征—LPC倒谱,并进行矢量量化处理。 (2)研究统计学习理论以及在此基础上发展起来的模式识别方法—支撑向量机,其中包括机器学习问题的表示、经验风险最小化、推广性的界、结构风险最小化、最优分类面、广义最优分类面、高维空间的最优分类面—支撑向量机等。 (3)研究隐马尔可夫模型识别方法,包括语音信号的隐马尔可夫模型物理含义、Markov链的定义、隐马尔可夫模型种类和参数估计方法以及隐马尔可夫模型算法实现中的问题等。 (4)最后,在自己建立的语音库的基础上,将两种识别方法进行计算机仿真,并给出实验结果。