基于距离与相似性度量学习的说话人识别研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户：leng159461

【摘要】

：

说话人识别是以语音作为识别特征,采用机器学习方法对语音信息进行处理,自动进行识别说话人身份的技术。目前,基于I-vector模型的说话人识别模型性能良好,已经成为说话人识别

【作者】

：

万艳红

【出处】

：

江西师范大学

【发表日期】

：

2004年期

【关键词】

：

说话人识别度量学习马氏距离相似性度量学习 SUB-SML

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别是以语音作为识别特征,采用机器学习方法对语音信息进行处理,自动进行识别说话人身份的技术。目前,基于I-vector模型的说话人识别模型性能良好,已经成为说话人识别领域中的主流模型。本文主要是对基于I-vector模型的说话人识别算法进行研究,并在此基础上引入距离与相似性度量学习算法。度量学习算法通过使得同类样本更紧凑,非同类样本更分散,提高说话人识别系统性能。本文主要研究KISS(Keep It Simple and Straightforward)与SUB-SML(intra-person Subspace Similarity Metric Learning)度量学习算法在说话人识别系统中的应用。KISS算法具备可利用大规模数据集和可扩展性等特点,通过引入等价约束关系学习度量矩阵,而且学习得到的度量矩阵可保证同类样本强相关。本文将KISS度量学习算法应用在说话人识别系统中,通过对i-vector向量进行KISS度量矩阵线性变换,减少信道差异和说话人个人内在变化对系统的影响。在NIST SRE 2014库上进行实验,分别使用余弦相似分类器和马氏距离分类器进行打分判别。实验结果表明KISS模型采用余弦相似分类器打分可以提高系统性能,而且采用采用马氏距离分类器打分系统性能提高更显著。此外,对KISS模型与PLDA模型进行得分融合实验,实验结果表明系统性能得到进一步提高。SUB-SML算法从保持相似性度量学习的鲁棒性和判别性两方面出发,提出在说话人个人子空间内学习训练度量矩阵,联合马氏距离度量和双线性相似性度量,形成广义的相似性度量学习。NIST SRE 2014库只提供训练样本的标签信息,所以需要为SUB-SML算法构造训练样本对集合。本文提出选取欧式距离最大的相似对和欧氏距离最小的非相似对构造训练样本对集合,使得训练得到的度量矩阵具备判别相似度低的同类样本以及相似度高的非同类样本能力。本文将SUBSML度量学习算法应用在说话人识别系统中,提出新方法构造SUB-SML算法的训练样本对集合,并且对i-vector向量进行SUB-SML度量矩阵线性变换。实验结果表明基于SUB-SML模型与基线i-vector模型相比系统性能有所提高,而且采用新方法构造的训练样本对集合的SUB-SML模型性能提高显著。SUB-SML算法联合马氏距离度量和双线性相似性度量,若只考虑马氏距离度量或双线性相似性度量,则分别得到SUB-ML和SUB-SL算法。本文将SUB-ML和SUB-SL度量学习算法分别应用到说话人识别中,实验在NIST SRE 2014年库上进行,结果表明这两种模型性能均优于传统余弦距离分类器模型。此外,还对SUB-ML模型与基于SUB-SL模型进行系统得分融合实验,实验结果表明融合后的系统性能比基于PLDA模型的系统性能更佳。

其他文献

豫剧的仪式化演出组织整合研究

豫剧作为河南省的地方戏剧,对当地人民来说不仅是一种文化娱乐,也是他们与神灵对话的媒介。在焦作地区,每逢火神祭祀、丧葬仪式、节日庙会等重要的场合时,当地村民都会自发请

学位

豫剧仪式化表演响器班民营剧团

GP与TP方案诱导化疗联合同期放化疗治疗局部晚期鼻咽癌的临床观察

目的:讨论GP方案(吉西他滨+顺铂)和TP方案(紫杉醇+顺铂)诱导化疗联合同期放化疗治疗局部晚期鼻咽癌患者的临床疗效及毒副反应。方法:随访我院2015.01-2017.06经病理组织证明

学位

诱导化疗局部晚期鼻咽癌同步放化疗临床疗效毒副反应

基于改进的位图存储及运算技术的spam算法优化研究与设计

随着信息化的逐渐普及,各行各业积累了大量的数据,而这些数字化资源中隐含了大量的,有价值的信息。因此,数据挖掘(Data Mining)应运而生,它负责挖掘数据潜在的知识并用于决策

学位

数组有效值占比spam算法

种植体周围炎小鼠模型的建立及NLRP3在模型中的表达研究附20例临床病例汇报

目的:构建小鼠种植体周围炎模型,研究NLRP3在小鼠种植体周围炎牙龈组织中的表达,阐明其对种植体周围炎发病的作用。方法:研究使用36只4周龄C57BL/6J雄性小鼠,拔除右侧上下第

学位

种植体周围炎NLRP3动物模型

多巴酚丁胺通过cAMP-PKA/CREB信号通路对脓毒症肺水肿体外模型中AQP5表达的影响

目的探讨在脓毒症肺水肿时,多巴酚丁胺对水通道蛋白5(Aquaporin5,AQP5)表达的影响以及可能的分子机制。方法通过培养人肺腺癌细胞系A549,以内毒素脂多糖(Lipopolysaccharid,L

学位

脓毒症肺水肿多巴酚丁胺水通道蛋白5(AQP5)环磷酸腺苷(cAMP)蛋白激酶A(PKA)

无创性尿动力学参数模型对逼尿肌收缩力预测价值分析

目的:分析探讨构建无创性尿动力学参数模型对逼尿肌收缩力预测价值。方法:回顾性分析2016年-2019年在南华大学附属邵阳医院泌尿外科初次行尿动力学检查的患者临床资料,共310

学位

无创性尿动力学逼尿肌收缩力

应用超声监测膀胱容量减少盆腔放疗中正常组织照射体积的研究

目的:探索应用常规B超设备监测膀胱容量变化规律,为盆腔肿瘤精准放疗减少肠道等正常组织照射剂量提供技术支持。方法:本研究收集2019年3月至2019年8月期间在郴州市第一人民医

学位

超声监测膀胱容量盆腔肿瘤放疗

肝硬化肝衰竭合并感染患者预后因素分析

目的:回顾性研究分析感染对肝硬化肝衰竭预后的影响。其为患者的预防和治疗提供更为确切的方向,从而降低肝衰竭患者的病死率。方法:收集2016年6月-2019年6月我院住院收治的68

学位

肝硬化肝衰竭感染预后

沁水盆地南部高产水煤储层煤层气开发机理研究

为研究沁水盆地南部高产水煤储层煤层气开发机理,指导高产水煤储层开发实践,本文以15号煤层和顶板灰岩的水力联系作为切入点,采集了 8个灰岩水样和100多个煤层气井产出水样,

学位

15号煤层水K2灰岩水水演化模型产水影响因素数值模拟

氧化应激介导NLRP3炎性小体活化对艾滋病并肺结核发生IRIS时的影响

目的:观察通过对艾滋病并肺结核患者外周血淋巴细胞NLRP3mRNA表达量以及氧化应激指标(SOD、MDA)的检测,探讨其对发生IRIS时的影响。方法:本研究选取2018年08月至2019年10月于

学位

immune reconstitution inflammatory syndromeMDASODNLRP3

基于距离与相似性度量学习的说话人识别研究

其他学术论文