论文部分内容阅读
由于信息安全问题的不断涌现,在公共安全、金融、商业等领域,基于生物特征认证技术的产品需求逐渐膨胀。说话人识别作为唯一适合远程认证的技术,逐渐被各个领域所接受,并开始得到应用。但实用系统中,各式各样的语音采集设备与传输信道差异,使得训练语音与测试语音之间存在信道失配的情况,导致说话人识别性能急剧下降。这便是说话人识别中的跨信道问题,它也是影响说话人识别性能最重要的因素之一。因此,如何在最大程度上降低跨信道对识别性能的影响,将是本课题的研究重点。 本文从特征域、模型域及得分域这三个层面,采用一系列行之有效的算法,降低跨信道对说话人识别的影响,并尝试将迁移学习用于说话人识别中,并将其与传统的跨信道算法结合,以进一步提升说话人识别系统的性能。 1.在特征域上,分别验证有无特征弯折对于各系统的性能影响;在模型域上,将有害因子映射(NAP)与支持向量机(SVM)结合、潜在因子分析(LFA)与UBM-GMM结合来降低跨信道测试对识别的影响;得分域上,采取T-norm后,进一步提高跨信道环境下的说话人识别准确率。 2.基于迁移学习思想,分别将稀疏表示和无监督迁移分量分析用于说话人识别。稀疏表示利用UBM-GMM构建高斯超向量GSV来构造完备字典并通过L1范式最小化来求解识别结果;无监督迁移分量分析解决目标域数据缺乏而源域数据充足情况下的说话人识别问题,训练使源域与目标域差异最小的子空间,在最大程度上降低跨信道因素。将传统的跨信道算法,如有害因子映射、潜在因子分析,与稀疏表示和无监督迁移分量分析结合,分别验证这些算法在稀疏表示和无监督迁移分量分析框架上的跨信道性能。 3.在短语音情况下,传统的跨信道算法表现欠佳,因此引入i-vector。介绍了它的主要思想并给出总变化空间T及总变化因子w详细且直观的训练流程。