面向说话人识别的非线性频谱变换研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:huanghoubin101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是通过对说话人的个性特征进行分析和提取来达到确认或辨别说话人身份的目的。由于其具备数据采集设备的非接触性、简易性,价格比较低廉,易被用户接受等优点,是当前语音信号处理研究领域的研究热点之一,具有广泛的市场应用前景。本文在对现有说话人识别技术进行分析的基础上,重点研究分析了非线性频谱变换对说话人识别的影响,然后提出一种面向说话人识别的新的非线性频谱变换方法,讨论了其有效性及不足,并提出了进一步的研究方向。特征的选择与提取和模型的选取是影响说话人识别性能好坏的关键因素。目前受到广泛应用的特征参数是反映声道响应特性的倒谱系数,特别是基于人耳听觉特性的MFCC特征参数。虽然已经取得了较高的识别率,但是它反映的是语音特征,而不着重反映说话人个性特征。本文首先介绍分析了常用的LPC、LPCC和MFCC特征参数的说话人识别系统的性能。然后介绍了Mel尺度、Bark尺度及ERB尺度这三种非线性频谱变换,分析在不同的训练数据、不同测试时间的条件下,三种非线性频谱变换对应的说话人识别系统的性能。根据语音信号不同频带携带的个性特征信息量的不同,分析研究各个频带对说话人识别的贡献,得出每个频带的说话人相对误识率,提升对说话人识别贡献大的频带,而降低对说话人识别贡献小的频带。首先加权改进了Bark非线性频谱变换,将其应用于说话人识别系统,使得系统的性能得到提高。进而提出一种面向说话人识别的非线性频谱变换的方法以及特征提取算法。实验表明,与传统的Mel、Bark和ERB谱等非线性频谱变换相比,所提出的非线性频谱变换方法可以有效突出语音中的说话人个性特征,提高特征空间中类别的可分性。在同样的测试条件下,平均误识率降低至0.668%。在较长测试时间条件下,误识率甚至可以达到0,有效地提高了说话人识别系统的性能。
其他文献
空地一体化成为网络研究的热点,随着空天网络IP化的进行,地面网络很多技术逐步移植到了空天网络中,但空天网络很多区别于地面网络的本质特性决定了在空天网络应用这些技术时
车辆监控系统是GPS、GIS、通信技术和计算机技术的集成应用系统。其核心技术主要是GPS信息的采集与处理、通信处理和地理信息系统(GIS)的建立与管理。 本文主要完成了车载
嵌入式系统如今已广泛地渗透到了科学研究、工程设计、军事技术、各类产业和商业等许多领域,并且还在不断发展与延伸。嵌入式系统中又以ARM架构的运用最有前景,普及最为广泛
无线自组织网络(Ad Hoc网络)是近几十年来发展较快的一种具有自组织、多跳、无中心等特点的无线网络,整个网络由一系列移动终端组成且这些终端都具备无线收发装置,该网络目前
无线通信技术的快速发展极大地改变了人们的生活。进入21世纪,人们对通信服务的需求与要求日益提升,希望得到更快速,更优质的服务。但在有限的无线频谱资源条件下,我们要提供
无线传感器网络(Wireless Sensor Networks,WSNs)是一个由功率受限的传感器所组成的以无线多跳的方式进行感知和通信的自组织网络。无线传感器网络在军事行动、环境控制、智
本文以蔡氏电路为例,提出了一种基于蔡氏无量纲状态方程新的电路设计方法。首先对蔡氏无量纲状态方程进行变量的比例压缩变换、微分—积分转换和时间尺度变换。其次根据变换后
在码分多址(CDMA)系统中,扩频序列的相关特性和码集合大小直接影响系统的抗干扰能力和系统容量。采用单码扩频的第三代CDMA移动通信系统,由于扩频码相关特性的不理想,使得系统的
随着网络的进一步融合,研究异构网络中具有自治特征的资源管理方法已成为日益重要的课题,而研究这一课题的关键在于如何制定一个最优的网络选择方法使该网络具有自组织、自优
在全球性的网络化、信息化进程中,信息过量成为人人需要面对的问题,也就为信息处理提出了新的要求。信息处理技术由查询、统计、分析方法学延伸和扩展到数据挖掘技术。数据挖掘