一种声纹识别应用系统原型的设计与实现

来源 :东北大学 | 被引量 : 6次 | 上传用户:wulixx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是实现人们之间沟通交流的最直接和方便的手段,语音识别也就成为了实现这一梦想的关键性技术,声纹识别就是语音识别中的一个关键技术。声纹特征是从语音波形当中提取出来的说话人的生理和行为的语音特征,具有不易模仿、不易伪造和不可替代的性质,而且语音的获取渠道比较方便,未来很有可能在电子商务、银行、军事等领域得到应用。语音中既包含说话人的生物特征,就是先天发音器官差异,又包含说话人的行为特征。对于声纹识别系统中用的声纹特征,是不考虑语音当中的说话内容,提取的是说话人的个性特征,也就是说话人的生物特征。本文针对以前的声纹识别技术进行了分析和研究。为了获取高质量的声纹特征,首先要对语音文件进行预处理,其中重要的是语音的端点检测。语音在录制过程中,都会有背景噪音,本文提出了一种自适应去除噪音算法,能够有效的去掉语音当中背景噪音帧,为后面提取高质量的声纹特征做好了准备。在特征提取方面,本文比较了几种声纹特征的效果,最后确定使用美尔倒谱系数特征做为声纹特征由于美尔倒谱特征体现出来的是语音分帧后,一个帧的内部特征。通过设计一个滤波器,对提取的声纹特征进行二次处理,得到了一种新的特征,这种声纹特征即包含语音帧内特征,也包含语音帧之间的特征,更能代表说话人的特征。在识别阶段,本文提出了一种自学习识别算法,在识别的同时,能够对原有声纹特征模型进行优化,解决了声纹特征模型随时间质量变差的问题。
其他文献
在过去几十年里,传统的关系数据库管理系统(RDBMS, Relational Data-Base Management System)在数据管理方面发挥了重要的作用。但是,近年来随着计算机应用技术的不断发展,数
图像变形根据一定的变形函数将源图像映射到目标图像以产生图像的局部变形,该项技术可以被广泛应用于虚拟现实、动画、医学图像处理以及影视娱乐等各个领域。映射分为正向映
信息检索技术是当前最热门的研究课题之一,它主要研究如何从海量信息中快速准确的查找到用户需要的信息。但在实际应用中,由于用户查询描述方法的局限性,系统返回的检索结果
随着互联网规模的不断扩大,其中蕴含的信息和数据也在持续增长。信息抽取技术的目标是从互联网中的海量无结构化数据中挖掘出结构化的数据。实体关系抽取是信息抽取的子任务,
射频识别(Radio Frequency Identification,RFID)技术是从上世纪80年代走向成熟的一项自动识别技术,近年来发展十分迅速。 本论文首先充分分析了RFID技术的特点,在其基础之上
旅行商问题(TSP)是来源于实际应用的一个非常重要的组合优化问题。该问题的研究对于实际运用和科学研究都有着重大的意义。本文主要通过研究局部搜索算法和演化计算方法来更
无线传感器网络是由部署在监测区域内大量的廉价微型传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统,其目的是协作地感知、采集和处理网络覆盖区域中感知
中国高速列车的研究起步较晚,但其发展却十分迅速。在高速列车设计过程中,无疑需要对高速列车进行三维列车实体和自然场景模拟的虚拟现实仿真,直观的得到高速列车运行反馈,以
计算机辅助优化排样是计算机辅助设计与制造(CAD/CAM)技术的重要分支之一,解决的问题就是在给定的原材料上放置所需求的各种毛坯零件,使毛坯的布局最优,目的是在满足毛坯需求
信息化技术的不断深入应用,特别是网络技术的迅速发展,导致了数据的规模急剧增长。因此,如何保证海量数据的有效存储和管理,提高针对海量数据的处理效率成为人们日益关注的焦点。