基于高斯混合模型的说话人识别系统的研究

被引量 : 0次 | 上传用户:yu830329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。在生物认证技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到世人关注。 本文的工作是围绕基于高斯混合模型的说话人识别系统展开研究,在完成多项基本性能的测试和比较的基础上,对特征提取、分类算法、识别统计中的某些环节进行一定的改进,以便获得较高的识别率。本文的工作主要有以下几个方面: (1) 系统构建:在给出语音分段和识别率计算原则的基础上,首先研究了不同测试语音单位长度对识别率的影响情况,证明了这些原则的正确性和系统的可靠性;针对预处理过程中的预加重系数和加窗分帧帧长的选择进行实验,取得了预加重系数的最优值,以及在不同高斯混合模型阶数条件下的最佳帧长。 (2) 性能研究:在相同的测试条件下,研究了LPC、LPCC、MFCC这些主流基本特征的优劣,证明了MFCC这种充分模仿人耳听觉特性的特征对提高识别率的作用;在相同的测试条件下,研究了高斯混合模型的阶数对系统识别率的影响,分析了阶数过大或过小对系统的负面影响,并结合实际情况进行了选择;提出在EM算法的迭代过程中设置协方差阈值,并对不同阈值条件下的识别率进行实验对比,证明了将协方差阈值设置为0.10的普适性和可行性。 (3) 系统改进:对较为可靠的基本特征MFCC进行改进,引入差分倒谱概念并对改进前后的特征进行实验,证明了这种综合考虑前后帧影响的差分特征的有效性;考虑到传统最大期望算法存在着会出现奇异阵的缺陷,引入参数α来控制修正比例对迭代结果进行修正,验证了改进算法在参数估计上的有效性;针对系统判别准则中常用的传统概率打分法,采用归一化投票和设置比例阈值的方法改进,验证了归一化改进的局限性和比例阈值改进的有效性。 最后对本文工作进行了总结,同时对未来的研究工作进行了展望。
其他文献
针对中小学教师因普遍欠缺心理学知识,因而不能自觉运用心理学原理指导教育教学的共性情况,该文通俗扼要地介绍了皮格马利翁效应/罗森塔尔效应、框架效应、首因效应等几种教
戴维森的隐喻以其独特的视角挑战了传统的隐喻观。主要运用了对比研究的方法,从概念整合的角度探究了戴维森的隐喻理论,涵盖戴维森对隐喻的基本看法及其不完善性,旨在帮助人
曾经辉煌一时的俄罗斯共产党,近几年来势力不断下降,甚至面临着生死存亡的考验。在此情况下俄共进行了改革和调整。决定它命运的关键是能否与时俱进。
近些年来,随着我国土地资源日趋短缺,为充分利用有限的土地资源,建筑业的发展正在向高层和超高层建筑方向发展,这对建筑结构的设计和结构计算程序的使用提出了更高的要求。对
路桥工程建设对我国经济发展具有重要意义,对于促进我国城市化进程亦有重要作用。因此,对于桥梁路面建设的质量,我们必须给予应有的重视。加强修建技术投入,规避劣质路面的出
针对某公司风电主轴产品强韧性性能测试结果存在不合格风险的问题,对该产品进行了成分分析、性能检验、金相检验等一系列的理化检验,并分析了得到的检验数据结果,着重对有效
《颜氏家训》蕴含着丰富的教育思想,其中有不少涉及语文教育范畴,如关于语言学习、写作教学等,还有一些教育思想虽不是直接谈论语文教育的,但能够反映教育教学中的客观规律,
依法治国是我国的基本治国方略,而市民的法律意识提升是实现该方略的关键。而目前我国居民的法律意识虽然有所提升,但形势仍不容乐观。要有效提升市民的法律意识,首要的是分
该文通过对路遥《人生》的文本分析,指出主人公高加林因农村环境的改变开始背离土地追求个人利益的合理性,其中既包括农村环境"异化"的原因,也包括主人公自身对身体卫生和精