基于残差网络与注意力机制的声纹识别研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:shztky880
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹(Voiceprint)一词的概念最早是由指纹(Fingerprint)的概念衍生而来的。广义的讲,所有可以将一个人的声音,与其他人的声音区分开来的特征,都称之为“声纹”。声纹识别(Voiceprint Recognition)是一种根据说话人的音频来辨别确认说话人身份的技术,是一种较为新型、实用、发展空间大的人工智能技术。基于神经网络的声纹识别通常由音频预处理与特征提取、模型提取声纹特征、预测打分这三部分组成,音频进行特征提取后以张量的形式放入网络模型中训练,训练出声纹特征提取网络,声纹特征会用于预测打分。综上所述本文针对与文本无关的基于残差网络与注意力机制的声纹识别系统展开了研究,主要研究内容如下:第一,对声纹识别系统中提取声纹特征所用的残差网络resnet18与resnet34进行介绍,并对声纹特征向量维度对训练声纹识别模型准确度的影响展开研究,发现1024维的声纹特征训练出的声纹识别模型在测试集的效果最好。第二,对声纹识别模型展开研究,在网络中加入通道注意力机制,将残差网络与注意力机制融合,用含有SENet(Squeeze and Excitation Networks)的新残差块组成特征提取网络,对含有声纹特征信息更多的通道赋予更多权重,对无用的特征通道降低其影响,进而强化关键信息。通过实验证明新网络模型拥有更高的准确率。增大训练集的大小,通过实验发现训练出来的模型识别准确度有明显提升。第三,在Pytorch上基于上述提出的含有通道注意力机制的resnet34模型开发了简易的声纹识别系统,该系统拥有声纹注册、声纹确认、声纹辨认三个功能,并且对实际应用效果进行了测试,绘制测试结果的混淆矩阵,通过测试结果验证了声纹识别模型的准确度与声纹识别系统的有效性。本研究在zhvoice中文语音语料库上的8个开源数据集上进行模型训练与测试,数据集总共有900小时的音频,1 13万条文本。实验从模型结构和数据集的大小两个方向进行研究。分别使用resnet18和resnet34模型,改变用于训练模型所提取出的特征维度,256维效果最差,1024维效果最好。在残差网络中融合注意力机制后,Resnet18网络模型的准确度提升了 2.8%,renset34模型的准确度提升了 0.9%。在测试集不变的情况下使用更大的训练集进行训练,测试集的准确度提升了 3.1%。
其他文献
队章课程哪里来?新旧队章的变化在哪里?队章课程怎么建?一系列的问题引发少先队工作的思考,项目组自2016年起,先后在17所中小学试点研究,目的在于实现"每周一课时"少先队活动的推进与落实,聚焦主责主业,在少先队员中树立坚定的政治信念。
作为一名政治教师,对十九大一直紧密关注,十九大的内容非常丰富,在经济方面的总目标是贯彻新发展理念,建设现代化经济体系;政治方面的总目标是健全人民当家作主制度体系,发展社会主义民主政治;文化方面的总目标是坚定文化自信,推动社会主义文化繁荣发展。
中国经济已由高速增长转向高质量发展。加快新旧动能转换是实现高质量发展的必然选择。作为我国经济高质量发展的新动能,以电子商务等为代表的数字经济深刻地改变了我国的传统经济结构。数字技术在我国农村地区快速普及,以网络化、信息化和数字化为特征的数字乡村是数字技术在农业农村经济社会发展中的重要应用。利用数字技术赋能乡村发展,是建设“数字中国”、“乡村振兴”、“数字乡村”的重要战略,也是落实我国经济高质量发展
培育职业院校学生工匠精神是实现高质量发展和科技自立自强的有力举措,是新时代职业院校的历史使命和立德树人的重要途径。当前,不同层次的职业院校还存在着工匠精神和科学精神融合不足、校园工匠文化培育不够、“三教”改革进程缓慢等问题,成为制约职业院校学生工匠精神培育的阻碍。因此,应从强化顶层设计、抓好“三个课堂”培育校园工匠文化、实施“三教”改革攻坚等途径提升职业院校学生工匠精神的培育效果。
<正> 我们自1988年开始外用自配中药“三黄粉刺净”治疗痤疮118例,取得良好疗效,现报告如下: (一)临床资料门诊确诊的痤疮患者随机分为两组。三黄粉刺净为治疗组118例,特效粉刺露(济南日用化工厂、山东省皮肤病防治所生产)为对照组93例,共211例。其中男122例,女89例;年龄16—34岁,平均19.8岁;病程2个月—16年,平均3.2年。皮疹以面部为主。
期刊
目的 基于液质联用技术对冠心病痰瘀互结证小型猪血浆除磷脂外的代谢物进行代谢组学特征分析。方法 将小型猪分为对照组和模型组,采用高脂饲料喂养结合冠状动脉内皮损伤法建立冠心病痰瘀互结证小型猪模型。HE和Masson染色观察心肌组织病理变化;血浆样本用96孔SPE板进行除蛋白和磷脂处理,采用超高效液相色谱-四级杆飞行时间串联质谱(UPLC-QTOF-MS)对样本进行检测,偏最小二乘判别分析(PLS-DA
<正>国有企业干部队伍建设是一项长期的复杂的系统性工作,要不断完善工作机制,积极探索与企业发展相适应的干部队伍建设和管理体系,努力建设对党忠诚、勇于创新、治企有方、兴企有为、清正廉洁的国有企业干部队伍,为国有企业高质量发展增强核心竞争力。
期刊
在核心素养教育大背景下,很多教师在教学中开始了新的思索。初中美术课堂需要面对新时代的少年,美术教师也面临着各种挑战。教师应针对学生课堂练习的时间、质量及效率等特点采用多样的教学方式,尝试进行创意实践教学——拼图画练习。在实践中,拼图画练习不仅提高了学生的课堂学习效率与合作能力,而且增强了学生的学习兴趣与自信心。
目的观察沙库巴曲缬沙坦对持续性房颤患者心脏结构及功能的影响。方法选取持续性房颤患者120例为研究对象,随机分为对照组(60例)和观察组(60例)。对照组服用胺碘酮复律和维持治疗(0.2gtid,1个月;0.2gbid,第2个月;0.2gqd第3个月至12个月),观察组在对照组基础上加用沙库巴曲缬沙坦50mgbid。服药后1、6和12个月进行随访,观察患者房颤复发率、血流动力学、左心房、左心室结构及