论文部分内容阅读
说话人识别是语音信号处理技术中的一个分支,它有着十分广阔的研究和应用前景。它作为生物认证系统的一种,有着独特的优势,即它是以声音作为特征,其数据采集设备是非接触的,用户容易接受。其过程是从说话人的一段语音中提取出说话人的个性特征,通过对这些个性特征的分析和识别,从而达到对说话人进行辨认或确认的目的。首先,介绍了语音信号的预处理过程,即对语音信号进行特征提取之前,必须要经过的标准化处理。其中端点检测是语音信号预处理中非常关键的一步。针对带噪语音信号的端点检测,本文采用语音短时能频值作为语音端点检测的参数,该算法比传统的双门限算法具有较好的噪声鲁棒性。然后,分析了语音特征参数的提取过程,常用特征参数有LPC,LPCC和MFCC,其中MFCC参数是说话人识别系统研究中使用最多的特征参数之一。分析发现基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能;本文提出了MFCC的改进算法,即一种基于平滑幅度谱包络的MFCC参数,以降低基音频率对其的影响。实验结果表明,改进后的MFCC参数性能在整体上优于MFCC参数。最后,在说话人识别模型方面,矢量量化在语音信号处理中占有十分重要的地位,是说话人识别中常用的方法之一。本文以矢量量化为识别模型,并介绍了其改进算法,即基于方差和标准差的加权失真测度的矢量量化方法。利用Matlab程序对改进的特征提取方法和识别模型进行了实验仿真,仿真结果表明识别系统达到了较高的识别率。