论文部分内容阅读
说话人识别是语音信号处理中一个重要的研究内容,是根据包含在说话人语音中表征说话人特征的参数来识别说话人的过程。随着语音处理和相关技术的进步与发展,说话人识别开始广泛地应用于金融、商务、公安司法及安防系统等领域,说话人识别技术越来越受到重视,具有广阔的研究和应用价值。 在安静环境下,说话人识别的效果都较好,但是在实际的低信噪比环境下,系统的识别率下降,对此进行了研究实践。主要工作如下: 1.首先阐述了说话人识别的原理及分类,分析了说话人识别技术的研究历史、现状以及今后研究方向。 2.主要研究了语音信号的端点检测,详细讨论了几种检测方法,通过在不同信噪比下的实验结果表明:基于子带能量的方法在低信噪比下具有良好的端点检测能力。 3.对于不同的说话人识别系统,详细讨论了基于ANN、DTW以及GMM的识别算法,对比研究了ANN和DTW的识别性能。对于GMM系统,改进了端点检测的方法,取得了较好的识别效果。 4.研究了说话人识别的改进方法,说话人语音特征参数的提取、新理论的应用以及语音增强。