【摘 要】
:
随着信息技术的不断发展,身份验证的快捷性、方便性、经济性显得越来越重要。说话人识别以其独特的优点,在生物识别领域占据着重要的地位。说话人识别的目的是通过对训练语音建
【出 处】
:
华北电力大学(保定) 华北电力大学
论文部分内容阅读
随着信息技术的不断发展,身份验证的快捷性、方便性、经济性显得越来越重要。说话人识别以其独特的优点,在生物识别领域占据着重要的地位。说话人识别的目的是通过对训练语音建立模型,然后将待测试的语音与已建立的模型进行匹配,来完成说话人的辨认或确认,即说话人的归属性。说话人识别技术的关键是语音特征的提取和说话人模型的建立等问题,然而,在历经了一段时间的快速发展之后,说话人识别并没有得到跨越性的发展。本文在研究了当前说话人识别算法的基础上,通过研究说话人特征组合的有效性和信息融合的准确性,实现了基于多特征决策融合的说话人识别系统。本文首先对说话人识别中的一些基本理论进行概述,并介绍和分析了说话人识别常用的一些特征参数。在CASIA和TIMIT语音库中,研究了采用Spearman系数在特征层级上进行的两两特征之间的相关性,通过比较相关系数,选择相关性较小的MFCC和LSP参数作为本文的特征参数组合。此外,本文分别对特征级融合、匹配分数级融合、决策级融合三种融合算法做了详细的介绍,并利用Matlab在两个语音库上分别对不同的特征组合进行三种融合方法的仿真,其中,决策级采用直接融合和D-S证据理论融合两种方法,通过对实验数据的比较和分析,得出采用MFCC&LSP的D-S证据理论决策融合的识别系统是最优的。为了证明该系统的有效性,本文将其与单一的MFCC、LSP参数得到的识别率进行对比,得出识别率至少能提高5%,说明采用相关系数较小的MFCC&LSP参数组合是合理的,同时也证实了本文采用MFCC&LSP的D-S证据理论决策融合系统的识别性能是较好的。
其他文献
随着社会的发展,目标检测与跟踪技术在视频监控领域得到了越来越多的应用,然而,在传统的目标检测与跟踪算法中,研究人员往往更注重算法的有效性,而弱化了对算法实时性的考虑,
随着高速铁路的发展和人们对宽带无线通信需求的增加,如何为高铁列车旅客提供可靠稳定的宽带无线通信服务,是高速铁路无线通信亟待解决的问题。和典型低速移动环境相比,在高
正交频分复用是一种减轻频率选择性衰落的技术。单载波频分多址利用单载波调制、傅里叶预编码的正交频分复用和频域均衡,能够获得和正交频分多址相似的复杂度和性能,并且由于继
人类的大脑是一个十分复杂的系统,它具有组织神经元进行信息处理的能力,并以比数字计算机更快地速度对信息进行并行以及非线性的处理。一直以来,建立具有人类智慧的机器或自
摘要:视频的应用越来越广泛,如何保证视频质量也是讨论的越来越多的问题。对视频编解码器进行测试是保证视频质量的一个重要方面。然而视频编解码器的测试与通常的软件测试存
目前,针对GSM-R系统这种特殊传播环境的干扰分析,还处在一个相对较初步的阶段。或者说,这种特殊场景下的干扰分析,被大家当作一个特殊情况,还没有引起足够的重视。但是,其他
人类面部表情在人们的日常生活、交流中扮演着十分重要的角色。通常,我们所指的人类面部表情被称之为“宏表情”,其持续时间一般在0.5s~4s之间,容易被人察觉和辨别。然而,有
民用的导航系统由于定位精度有限,无法对复杂的路况信息进行实时的探测;再加上导航系统缺乏针对盲人(视障人士)进行路径搜索与规划的能力,更无法为视障人士的安全出行提供指
摘要:在资源受限的无线多媒体传感器网络中存在大量的图像数据需要处理和传输。在有限条件下,为了充分利用资源,设计能够综合考虑能量消耗、压缩率和图像质量等性能要求的图像
粗糙集理论是20世纪80年代初由波兰数学家Pawlak Z.首先提出的一种新型的处理模糊和不确定知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的