基于GMM的声纹识别技术的研究

被引量 : 14次 | 上传用户:yaofj0226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别又称为说话人识别,都是根据人生物特性来判断人的身份。声音作为人最自然的交流手段,以其无法比拟的优势被广泛应用到身份识别中去。本文的工作是研究基于高斯混合模型的说话人识别技术,并对特征参数的选取和识别算法做了一定的改进,以便获得较高的识别率。根据说话人识别的几个阶段,详细阐述了说话人识别技术的特征提取,模型建立等环节。声纹识别的建模有很多种技术,目前高斯混合模型以其建模简单、性能好、与文本无关等特性是使用最多的建模方法之一。本文介绍了高斯模型的建立、参数估计以及识别方法。在识别阶段根据语音帧中的某些特定不好的语音帧会影响系统的识别率的情况,给出了一种基于帧投票的判决方案。由于高斯混合模型在说话人很多的时候计算量较大,本文使用VQ方法来对高斯混合模型分成男声和女声两个部分,并使用动态时间规整算法来计算各个基音之间的距离来减少模型的对比次数,从而减少了识别时间。目前,大部分的声纹识别模型都是基于MFCC的混合高斯模型,MFCC包含语音频率结构的时间变化信息,相对稳定,但不同的声纹之间容易相互模仿,本论文针对MFCC的易模仿性,增加了另一种特征参数,基音周期,基音周期包含了语音频率结构信息,虽然会受到说话人健康状况的影响,但不容易模仿,将二者结合用于声纹识别。针对MFCC特征参数会损失人的部分声学特性的情况,将动态MFCC系数加入到特征向量中,又由于加入后会使得特征向量变得复杂,根据他们对身份识别率的贡献给出了一种加权的MFCC。在文章的最后部分进行了实验验证。验证了特征参数、高斯混合模型阶数、加权的MFCC等对识别率的影响。实验发现,MFCC的识别率高于LPCC识别率,MFCC结合动态MFCC后的系统识别率有着明显的提高,加权的MFCC识别率高于原MFCC识别率并且和结合动态MFCC的识别率相近,这说明加权的MFCC在提高了识别率的基础上又减少了计算的复杂度,最后分析了基音周期的作用与影响。
其他文献
目的探讨二甲双胍在妊娠期糖尿病临床治疗中的应用效果,观察其对于患者妊娠结局的影响。方法以98例妊娠糖尿病患者为研究对象,分为观察组(二甲双胍+胰岛素)和对照组(胰岛素)
随着人们生活水平的提高,互联网洗涤行业因其便利性得到迅猛发展,"互联网+洗涤"模式是洗涤业发展的必然趋势。对O2O模式应用于洗涤行业所面临的难题和前景进行深入研究,并提出相
迭连组合轮系是将附加的行星式轮系或组合轮系以迭连方式装置在基础轮系上,构成迭连组合轮系。本文分析以2KH—WN型行星轮系为基础轮系,分别以单一周转轮系、并联轮系、反馈
目前,国内外学者对喷气织机引纬流场的特性及结构优化改进的研究较多,但是关于能够反映主喷嘴喷射性能好坏,并决定织物质量及织机工作效率的纱线阻力的研究较少,对于影响纱线
在纺织工业的生产过程中,织物疵点的检测环节在织物生产质量控制中起着举足轻重的作用。随着计算机视觉和图像处理技术的蓬勃发展,近年来,关于织物疵点的研究已经成为图像处
通过建立洗衣工厂,利用有限的土地等自然资源,集合一定区域内所有服务设施,规模化管理,为大众提供多样化、专业化洗衣服务。针对工厂运营方式进行了研究及创新,洗衣工厂模式
本文从明清香几部件形态和装饰纹样形态两方面入手,依托收集到的实际图片资料和以往相关研究文献,对明清香几造型进行深入研究。其研究成果以期为建立一个相对完整的明清香几
特色,往往就是优势和强项。在谋划经济文化发展的时候,上至国家,下至乡镇,都十分重视制定特色发展战略,力求以特取胜。西林拥有丰富的特色资源。无论区位和自然条件,还是历史文化积
会议
乳链菌肽(Nisin)是乳酸链球菌或乳酸乳球菌代谢产生的一种小分子多肽。因其对G+菌及其芽孢有抑制作用,但对人体无毒副作用的特点,而被作为一种天然绿色的食品防腐剂广泛用于
目的了解深圳市乙型肝炎母婴阻断效果及其影响因素,为制定乙肝防控策略提供科学依据。方法从医院收集2007-2009年HBsAg阳性产妇及其新生儿基本资料,设计统一的调查问卷,采集