采用音素分类的因子分析说话人识别方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：aji_y

【摘要】

：

提出一种利用深度神经网络和语音学知识进行文本无关的说话人识别的方法.采用深度神经网络(Deep Neural Netw ork,DNN)来进行有监督的因子分析建模方法是目前与文本无关说话

【作者】

：

马啸空郭武

【机构】

：

中国科学技术大学电子工程与信息科学系语音及语言信息处理国家工程实验室,

【出处】

：

小型微型计算机系统

【发表日期】

：

2016年09期

【关键词】

：

说话人识别深度神经网络音素分类因子分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出一种利用深度神经网络和语音学知识进行文本无关的说话人识别的方法.采用深度神经网络(Deep Neural Netw ork,DNN)来进行有监督的因子分析建模方法是目前与文本无关说话人识别的研究热点,在此基础上挖掘了不同的音素对识别性能的影响.首先根据语音学知识对DNN的输出节点进行分类,在说话人建模过程中,根据不同的类别来提取不同的后验因子(i-vectors),然后采用拼接的方式得到一个高维的i-vector用于话者识别.在NIST SRE 2012的核心测试任务上,相对于无监督的全空间变量因子分析与基于DNN的因子分析方法,提出的算法都有不同程度的性能提升.综合来看,超过了目前已知的最佳系统性能. This paper proposes a method of text-independent speaker recognition using deep neural networks and phonetic knowledge.Adopting a supervised Neural Network (DNN) for supervised factor analysis modeling is a method that is independent of text Recognition of the research hot spots, on this basis, tap the different phonemes on the recognition performance.First, according to the phonetic knowledge of DNN output nodes are classified in the speaker modeling process, according to different categories to extract different post (I-vectors), and then use the splicing method to get a high-dimensional i-vector for speaker identification.At NIST SRE 2012’s core testing tasks, compared with unsupervised full-space variable factor analysis and DNN Factor analysis method, the proposed algorithm has varying degrees of performance improvement.Overall, beyond the best known system performance.

其他文献

自由转体180°

在小钢炮阵营里，有越来越多的新面孔出现，这次作为体操选手参赛的可谓实力不俗。它们只为了一个目标--更快、更轻盈。

期刊

体操目标参赛

软基加固施工技术在市政道路中的有效应用

市政工程和城市居民的日常生活关系密切,其中道路工程的质量更是关系到人们的日常出行安全,近年来,质量问题越来越深受人们的重视.软基加固是我国城市道路施工当中的重要技术

期刊

软基加固技术道路施工技术运用

国内建材厂商进军俄罗斯

期刊

国内建材厂商