基于张量结构的说话人证实技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:oswaldhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人证实技术是语音信号处理领域中的重要研究方向,也是生物认证技术的重要手段。其主要任务是以提取目标说话人的训练语音和测试语音的声学特征为基础,建立说话人模型,通过比较二者达到识别验证目的。提高声学特征鲁棒性,保障系统的识别性能是说话人证实技术的研究重点。针对传统声学特征易受噪声环境影响的问题,本文提出一种基于张量结构的改进的MFCC特征参数提取方法。该方法把不同说话人的对数滤波器组能量构成一个三阶张量,利用加了非负约束条件的张量PCA分析获得投影矩阵,将对数滤波器组能量在DCT变换之前进行投影,从而得到改进的语音特征参数T-MFCC。实验结果表明,与传统MFCC相比,在低信噪比的条件下,T-MFCC并没有像MFCC一样出现明显衰减现象,而是保留了比较清晰的特征信息。并且在同等噪声环境下,相较于其他方法,基于T-MFCC的说话人证实系统具有更低的等错误率。这是由于张量的PCA方法在完成降维和去噪任务的同时,能够更好地保留原始语音数据关于不同说话人之间的内在联系信息。一般的建模方法容易造成有用信息的丢失,而张量结构的模型不仅可以很好地保留不同说话人之间的内在关联,还能挖掘出同一说话人不同语音片段之间隐含的有用信息。因此本文提出一种基于非负张量分解技术的说话人建模方法进行分类识别,对每个说话人利用训练语料提取出的特征建立维度为feature?frame?session的特征张量,利用ALS法对其求取非负张量分解,获得说话人i模型的核张量Gi及其因子矩阵,最后将测试语音的特征投影到因子矩阵对应的子空间,获得投影张量,将其与Gi利用Frobenius范数进行比较,实现识别任务。实验表明,针对说话人识别的任务,与其他传统的建模方法相比,张量结构的说话人模型具有更高的识别准确率。综上,本文的工作内容是通过利用张量结构的数据分析方法,针对噪声环境的特征提取,提出了T-MFCC的鲁棒特征提取方法,并且使用非负张量分解技术进行说话人建模,从而达到提高系统识别准确率的目的。
其他文献
现实生活中,车位使用情况受各种条件影响导致无法精确预测。通过研究车位空闲率,提高其预测精度,使诱导系统总体服务代价最小具有重要意义。本文主要包括:首先,为了提高停车
医学图像中病变的分割和随后的定量评估为神经病理学分析提供有价值的的信息,能够对治疗方法的优先规划,病理性的检测和预后具有重大意义。脑白质异常高信号(White matter Hy
随着5G通信系统的发展,进一步激化了高速模数转换器(ADC)与相对低速的数字信号处理器(DSP)之间的矛盾,使得数字下变频器(DDC)被广泛应用到高频段通信系统中,以用于降低ADC中
黄淮海地区是中国重要的大豆产区之一,提高该区的大豆生产水平至关重要。该区前茬为小麦,播种时田间秸秆量大且处理困难,大豆播种质量差,进而影响大豆生长和产量形成。近年来,课题组协同国家大豆产业体系针对黄淮海大豆生产现状和技术需求,研制出免耕覆秸精量播种技术,为黄淮海麦茬大豆生产提供了新的技术途径。本研究试验采用裂区设计,主因素是品种,副因素是种植密度。试验品种为中作XA12938、中黄13和豫豆22。
高时空分辨率NDVI数据集能够更好地反映植被物候的变化,对于监测植被在时间域上的变化信息具有重要意义。本文旨在提出一种新的时空融合模型用于构建高时空分辨率NDVI数据集,
创新是人类特有的认知能力和实践能力,是推动民族进步和社会发展的不竭动力。在当前我国“大众创业,万众创新”的新常态背景之下,从小抓起,发展中小学创新教育意识,提升公民
电荷泵作为一种电压变换电路,相较于电感式电压变换电路,具有体积小、易集成且电磁干扰小等优点。由于电荷泵良好的变压特性,它被广泛应用于存储芯片、驱动芯片以及各种物联
背景:术后辅助经导管动脉化疗栓塞术(TACE)有利于延长生存期,减少肿瘤复发。但对小肝癌的影响尚不清楚。我们的目的是回顾性分析肿瘤小于5cm的患者肿瘤切除术后再行辅助性TACE的无瘤生存情况。方法:本研究纳入2014年1月至2016年12月行肝切除术的肝癌患者307例。其中172例患者仅行手术治疗(A组),135例患者行手术切除后辅助性TACE治疗(B组)。倾向评分匹配(PSM)分析用于最小化两组
微孢子虫是一种专性细胞内寄生的、可形成孢子的真核病原菌。在自然界中普遍分布,具有广泛的宿主,可以侵染无脊椎动物到脊椎动物几乎所有生物,甚至人类。微孢子虫主要通过食物和水进行传播,并引发微孢子虫病,是一类能够引起人类发病的人畜共患寄生虫病。我国已经成为毛皮动物养殖与裘皮加工大国,且产业发展具有强大势头,我国居民对蓝狐、水貂等“黄金裘皮”的需求不断增加,促使该产业成为我国特种经济动物养殖业的重要组成部
得益于白光LED(WLED)具有高光效、小体积、长寿命、节能环保等优点,现已被大量地应用照明行业。作为WLED的重要组成部分,荧光粉的性能将对WLED的发光效果产生重要的影响。YAG:C