MMCE算法在因子分析概率统计模型中的应用

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:gongwen_2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在说话人识别领域中,基于模型的方法是最有效的,概率统计模型属于该类方法,GMM和HMM都是典型的概率统计模型,目前,受到十分广泛的研究,具有越来越重要的研究意义和实用价值。近年,说话人概率统计模型成为研究领域的一大热点。然而,基于这类模型建立的说话人识别系统在应用于实际环境中时还存在很多难题:特征矢量存在帧内相关;大文本情况下模型参数过多且不能很好分类;计算复杂系统开销大以及训练速度慢;训练算法分类优化程度不够以及不灵活等。针对上述问题,我们开展了下述工作:在对说话人识别最常用的两种概率统计模型:高斯混合模型(GMM)和隐马尔可夫模型(HMM)进行综述的基础上,对其中基本算法的优缺点进行了深入的研究和分析。详细分析最小分类错误算法(MCE)的优缺点,针对现在GMM和HMM训练中普遍用到的MCE算法存在的问题,尝试性地提出相应的改进算法MMCE,即通过一个有序排列组来代替损失函数的重复判别,以便增加训练灵活性,避免复杂而重复的比较计算。对MMCE算法的实现和参数调解过程进行推导,论述因子分析方法与GMM/HMM结合成因子分析高斯混合(FAGMM)和因子分析隐马尔可夫模型(FAHMM)的过程和概念;推导出因子分析模型的EM训练算法和MMCE训练算法;实现了MMCE和FAGMM/FAHMM的结合,于是就形成新的FAGMM+MMCE和FAHMM+MMCE模型。基于50个人语音库的说话人实验表明:MMCE算法较MCE和EM训练时,模型的识别性能更好,训练速度更快。另外,对FAGMM+MMCE和FAHMM+MMCE模型的抗噪声性能研究的实验中证明:在不同信噪比的白噪声、各类常见的真实噪声环境下,模型取得比较好的抗噪声性能,而且优于其它的方法。本文将因子分析方法和MMCE算法结合用于GMM/HMM,形成新的FAGMM/FAHMM模型,不仅提高了识别率,加快了训练速度,而且抗噪声性能更优越,具有一定的实际意义。
其他文献
本文通过对荣华二采区10
期刊
运动估计是视频编码中的关键模块,用于消除视频数据的时间冗余。运动估计需要从搜索窗口中寻找最佳匹配,以减少残差数据,因此,作为衡量目标块和候选块的相似度的匹配标准,对
随着工业自动化的程度越来越高,高压VDMOS器件的作用正日益显现出来。根据本课题组研究工作可知,VDMOS功率器件的研制在我国还属于起步阶段,对于高压VDMOS的研究还不够成熟。因
芒草是一类高大禾本科植物的统称,广泛分布于我国南北各地,具有生物量高、适应力强、纤维品质优良等优点,被公认为最具潜力的能源植物之一。本文主要通过以下几个方面对芒草进行了研究:对芒草种质资源进行采集、对其形态学农艺性状比较:采用了ISSR方法对不同采集地点的105份芒草材料的遗传关系进行了研究。研究结果如下:1、不同来源地的芒草的形态学特征有一定差异,在统一种植两年后其形态特征具有趋同显现。其中43
随着信息化的快速发展,各企事业单位逐步建立起很多信息化系统,这些不同时期、不同部门建立的信息化系统往往相互独立,所使用的数据库产品也往往各不相同。这就形成了各企事