基于多特征决策融合的说话人识别研究

来源 :华北电力大学(保定) 华北电力大学 | 被引量 : 0次 | 上传用户：klzvms1

【摘要】

：

随着信息技术的不断发展，身份验证的快捷性、方便性、经济性显得越来越重要。说话人识别以其独特的优点，在生物识别领域占据着重要的地位。说话人识别的目的是通过对训练语音建

【作者】

：

杨迪

【机构】

：

华北电力大学

【出处】

：

华北电力大学(保定) 华北电力大学

【发表日期】

：

2013年期

【关键词】

：

说话人识别特征组合 Spearman相关系数决策级融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的不断发展，身份验证的快捷性、方便性、经济性显得越来越重要。说话人识别以其独特的优点，在生物识别领域占据着重要的地位。说话人识别的目的是通过对训练语音建立模型，然后将待测试的语音与已建立的模型进行匹配，来完成说话人的辨认或确认，即说话人的归属性。说话人识别技术的关键是语音特征的提取和说话人模型的建立等问题，然而，在历经了一段时间的快速发展之后，说话人识别并没有得到跨越性的发展。本文在研究了当前说话人识别算法的基础上，通过研究说话人特征组合的有效性和信息融合的准确性，实现了基于多特征决策融合的说话人识别系统。本文首先对说话人识别中的一些基本理论进行概述，并介绍和分析了说话人识别常用的一些特征参数。在CASIA和TIMIT语音库中，研究了采用Spearman系数在特征层级上进行的两两特征之间的相关性，通过比较相关系数，选择相关性较小的MFCC和LSP参数作为本文的特征参数组合。此外，本文分别对特征级融合、匹配分数级融合、决策级融合三种融合算法做了详细的介绍，并利用Matlab在两个语音库上分别对不同的特征组合进行三种融合方法的仿真，其中，决策级采用直接融合和D-S证据理论融合两种方法，通过对实验数据的比较和分析，得出采用MFCC&LSP的D-S证据理论决策融合的识别系统是最优的。为了证明该系统的有效性，本文将其与单一的MFCC、LSP参数得到的识别率进行对比，得出识别率至少能提高5%，说明采用相关系数较小的MFCC&LSP参数组合是合理的，同时也证实了本文采用MFCC&LSP的D-S证据理论决策融合系统的识别性能是较好的。

其他文献

基于DAVINCI平台的运动物体捕捉系统研究

随着社会的发展,目标检测与跟踪技术在视频监控领域得到了越来越多的应用,然而,在传统的目标检测与跟踪算法中,研究人员往往更注重算法的有效性,而弱化了对算法实时性的考虑,

学位

目标检测视频监控Codec Engine

地面高速移动宽带无线通信之越区切换研究

随着高速铁路的发展和人们对宽带无线通信需求的增加,如何为高铁列车旅客提供可靠稳定的宽带无线通信服务,是高速铁路无线通信亟待解决的问题。和典型低速移动环境相比,在高

学位

LTE高速移动场景移动中继资源分配越区切换

LTE上行链路信道估计与均衡算法研究

正交频分复用是一种减轻频率选择性衰落的技术。单载波频分多址利用单载波调制、傅里叶预编码的正交频分复用和频域均衡，能够获得和正交频分多址相似的复杂度和性能，并且由于继

学位

单载波频分多址信道估计离散余弦变换小波去噪频域均衡算法

时延复数神经网络的吸引集与不变集研究

人类的大脑是一个十分复杂的系统,它具有组织神经元进行信息处理的能力,并以比数字计算机更快地速度对信息进行并行以及非线性的处理。一直以来,建立具有人类智慧的机器或自

学位

复数神经网络微分不等式指数稳定性全局吸引集正不变集

视频编解码器的测试技术研究

摘要：视频的应用越来越广泛,如何保证视频质量也是讨论的越来越多的问题。对视频编解码器进行测试是保证视频质量的一个重要方面。然而视频编解码器的测试与通常的软件测试存

学位

视频编解码器软件测试简单错误错误定位比特流

GSM-R同频干扰相关性研究

目前,针对GSM-R系统这种特殊传播环境的干扰分析,还处在一个相对较初步的阶段。或者说,这种特殊场景下的干扰分析,被大家当作一个特殊情况,还没有引起足够的重视。但是,其他

学位

相关系数阴影衰落Wilkinson方法同频干扰概率GSM-R系统

基于双时间尺度卷积神经网络的微表情识别

人类面部表情在人们的日常生活、交流中扮演着十分重要的角色。通常,我们所指的人类面部表情被称之为“宏表情”,其持续时间一般在0.5s~4s之间,容易被人察觉和辨别。然而,有

学位

自发微表情双时间尺度卷积神经网络小数据量SVM

基于RBF网络和Q学习的路径搜索与移动导盲系统设计

民用的导航系统由于定位精度有限,无法对复杂的路况信息进行实时的探测;再加上导航系统缺乏针对盲人(视障人士)进行路径搜索与规划的能力,更无法为视障人士的安全出行提供指

学位

路径搜索启发式Q学习RBF网络盲道识别移动导盲系统

无线多媒体传感器网络高能效JPEG图像编码算法研究

摘要：在资源受限的无线多媒体传感器网络中存在大量的图像数据需要处理和传输。在有限条件下,为了充分利用资源,设计能够综合考虑能量消耗、压缩率和图像质量等性能要求的图像

学位

无线多媒体传感器网络图像编码JPEG兴趣区域DCT

基于粗集的多知识库模型集成研究

粗糙集理论是20世纪80年代初由波兰数学家Pawlak Z.首先提出的一种新型的处理模糊和不确定知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的

学位

粗糙集多知识库规则度量模型网模型集成

基于多特征决策融合的说话人识别研究

其他学术论文