论文部分内容阅读
本论文主要内容是基于矢量量化(VQ)和隐马尔可夫模型(HMM)的说话人识别算法的研究和改进。 说话人识别是根据人的声音来识别人的一种生物认证技术,具有非常好的应用前景。而矢量量化和隐马尔可夫模型相结合则是在说话人识别领域中应用最广泛,效果最好的手段之一。 作者对说话人识别的各个环节的相关知识进行了广泛学习,其中包括语音信号预处理、获取特征量以及基于不同模型的识别方法。在研究过程中,重点对识别方法,即识别算法方面做了下列三个方面的工作: (1)基于VQ的说话人识别研究:适合于特定人识别,但该方法对于由说话人差别引起的语音特征的变化却无能为力。 (2)基于HMM的说话人识别研究:适合于非特定人识别,因为它作为统计模型能够吸收由不同说话人引起的语音特征的变化。 (3)基于模糊矢量量化以及隐马尔可夫模型(FVQ/HMM)的说话人识别研究:FVQ/HMM作为HMM的特殊形式,其模型参数数量较传统HMM少,模型学习对训练数据量要求不高;具有学习收敛速度快,适合于实时自适应学习;识别速度快,适合于实时大词汇量连续语音识别等特点。另外,它和传统分段VQ识别方法相比,FVQ/HMM可以得到最佳的分段效果,且通过模糊C-均值(FCM)聚类分析减少了码本的量化误差。