论文部分内容阅读
在信息飞速发展的今天,很多场合都需要对人们的身份进行确认和识别。近年来,说话人确认的重点逐渐从实验室转向实际复杂环境,训练语音和测试语音因信道不同而导致的失配问题越来越引起人们的重视,并成为当前说话人确认研究的关键问题之一。电话(手机)网络中,说话人的语音不仅来自不同的传输信道,而且也来自不同的话机麦克风。在说话人确认系统中,训练阶段在某信道下建立目标说话人模型,测试语音来自另一不同信道下时,就会产生失配,从而对说话人的身份进行误判,降低说话人确认系统的识别率。论文重点介绍了几种常用的信道失配补偿方法,包括特征域、模型域和评分域;探讨了SVM在说话人确认系统中的应用;最后针对电话手机语音与文本无关的说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,提出了一种基于高维空间映射的方法对系统进行补偿,主要研究内容如下:一、研究了基于概率统计高斯混合模型-通用背景模型(GMM-UBM)结构的说话人确认系统,深入了解了GMM训练算法和MAP算法,对其所存在的信道失配问题进行了分析。探讨了复杂环境下说话人确认的失配补偿方法,倒谱均值减、相关谱滤波、特征映射、零规整、测试规整,也包括近年来国内外研究的热点因子分析失配补偿算法。二、研究了采用GMM大矢量作为SVM的输入来建立说话人模型的方法,支持向量机是由线性可分情况下最优超平面发展而来,说话人确认作为二分类问题,目标说话人GMM大矢量作为+1类,冒认说话人GMM作为-1类来建立支持向量机模型,这样既可以减少因数据过多造成的计算量过大问题,又可以去除语音特征参数的冗余信息,有效地提高了说话人确认系统的性能。三、深入分析了SVM模型训练和测试因信道不同造成的系统失配问题,提出了一种基于高维空间映射的失配补偿算法,给出了基于支持向量机映射PSVM模型的失配补偿系统。它将每个说话人模型GMM的均值大矢量用已求得的映射矩阵进行补偿,通过PSVM核函数把特征参数映射到高维的空间,建立受信道信息影响更小的PSVM模型。映射矩阵是一个维数很高的矩阵,通过集外大量不同人已知信道类型的语音,利用距离来描述不同信道的语音之间的差异,从中来求取信道空间及映射矩阵。本文提出的方法用PSVM模型代替了传统的SVM模型,减少了信道信息对说话人确认系统的影响,提高了系统的识别率。