信道鲁棒的文本无关说话人识别及应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:wa0002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于信息安全问题的不断涌现,在公共安全、金融、商业等领域,基于生物特征认证技术的产品需求逐渐膨胀。说话人识别作为唯一适合远程认证的技术,逐渐被各个领域所接受,并开始得到应用。但实用系统中,各式各样的语音采集设备与传输信道差异,使得训练语音与测试语音之间存在信道失配的情况,导致说话人识别性能急剧下降。这便是说话人识别中的跨信道问题,它也是影响说话人识别性能最重要的因素之一。因此,如何在最大程度上降低跨信道对识别性能的影响,将是本课题的研究重点。  本文从特征域、模型域及得分域这三个层面,采用一系列行之有效的算法,降低跨信道对说话人识别的影响,并尝试将迁移学习用于说话人识别中,并将其与传统的跨信道算法结合,以进一步提升说话人识别系统的性能。  1.在特征域上,分别验证有无特征弯折对于各系统的性能影响;在模型域上,将有害因子映射(NAP)与支持向量机(SVM)结合、潜在因子分析(LFA)与UBM-GMM结合来降低跨信道测试对识别的影响;得分域上,采取T-norm后,进一步提高跨信道环境下的说话人识别准确率。  2.基于迁移学习思想,分别将稀疏表示和无监督迁移分量分析用于说话人识别。稀疏表示利用UBM-GMM构建高斯超向量GSV来构造完备字典并通过L1范式最小化来求解识别结果;无监督迁移分量分析解决目标域数据缺乏而源域数据充足情况下的说话人识别问题,训练使源域与目标域差异最小的子空间,在最大程度上降低跨信道因素。将传统的跨信道算法,如有害因子映射、潜在因子分析,与稀疏表示和无监督迁移分量分析结合,分别验证这些算法在稀疏表示和无监督迁移分量分析框架上的跨信道性能。  3.在短语音情况下,传统的跨信道算法表现欠佳,因此引入i-vector。介绍了它的主要思想并给出总变化空间T及总变化因子w详细且直观的训练流程。
其他文献
计算机大规模处理数据有多种方式,伴随着因特网的普及和云计算的高速发展,网络与计算机更紧密的结合在了一起。在庞大的网络环境中散布着大量的处理终端和服务器,发生错误或
面对互联网上海量的信息,个性化的定制服务逐渐成为人们获取信息的一个重要手段。其核心技术是如何对大量的用XML格式表示的数据进行快速而有效地处理。针对XML数据流,普遍采
近几年来,随着计算机软硬件技术的不断发展和应用范围的不断拓展,各个领域广泛出现了大量的不确定性数据。由于数据的不确定性,传统关联规则挖掘方法难以适用于不确定性数据。对
随着移动通信技术的迅速发展,许多计算节点可以在自由移动的过程中保持与网络的连接,这使得人们对信息的访问更加方便快速。各种智能嵌入或者移动设备都运行有移动数据库系统
随着在线服务网站的不断发展和日益普及,传统的购物方式已经逐渐延伸到虚拟网络环境中。电子商务网站独立于产品和服务,按照特定的交易规范为用户提供在线服务,称为第三方平
在多站点CSPS系统的协同控制问题中,系统的状态空间由多个站点的状态空间组成,其中每个站点的状态空间大小取决于其缓存库的容量大小,故系统状态空间的大小会随着站点个数的增加
随着虚拟现实、计算机图形学、计算机动画等技术的快速发展,数字化虚拟的人在工业设计、人机工程、医学人体仿真、3D电影和游戏等众多领域里得到了广泛的研究和应用。作为在计
面向服务的体系架构(Service Oriented Architecture, SOA)作为近年来IT业界的焦点,已经逐渐成为影响中国IT系统构建的主导思想。近年来发展迅速的Web服务技术具有的平台无关
无线传感网络是近年来快速发展的新一代的网络技术,随着其在军事、工业和日常生活中越来越多的应用,它的相关研究一直是当前科学技术研究中的热点问题。分布式探测技术源于航空
无线传感器网络是新一代传感器网络,是一门快速发展的高新技术,在安全监控、环境监测、健康医疗、前沿军事、精细农业、智能家居等领域具有广阔的应用前景。这种新的数据采集