说话人识别技术的研究与实现

被引量 : 0次 | 上传用户:fghngfhfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别,也称为声纹识别,是一种利用测试语音对说话人进行身份识别的认证技术。作为语音信号处理的一个分支,说话人识别技术在网络安全、身份鉴别、电话会议、司法查证等领域已经得到广泛应用。随着信息技术的发展,这种生物认证技术逐步走出实验阶段向商用化方向发展。说话人识别技术从识别任务上分为说话人辨认和说话人确认,从识别内容上又分为文本无关和文本有关两方面。本文研究的内容主要是从应用角度出发,实现一个与文本无关的说话人辨认系统。本文的主要工作包括以下几方面:(1)概述了说话人识别技术的发展状况,并从两方面进行分析:表征说话人语音的特征参数选取和说话人辨认系统训练模型的建立。(2)选用了美尔倒谱系数(MFCC)作为语音特征参数,在具体实现时,使用了基于短时能量和短时过零率的话音激活检测(VAD)算法。为了进一步提高识别率,系统中加入了差分美尔倒谱系数(AMFCC).(3)主要采用高斯混合模型(GMM)进行系统建模识别,并对EM算法的初始分类分别采用了K均值和一般分类两种方法进行比较。(4)基于Windows音频采集系统,用MFC搭建界面,实现了实时说话人识别系统。该系统具有实时录音、实时识别等功能,实验数据给出了50人样本库的识别结果。
其他文献
针对一起高压电缆交叉互联系统接地线夹严重发热缺陷, 通过对该交叉互联系统接地线夹发热查因和对其发热所致的潜在风险分析, 提出交叉互联系统接电线夹发热紧急带电处理的方
概念是人类思维的基本结构单位。每一门科学都是运用科学概念从一定侧面去反映世界的普遍联系和一定方面的本质。任何科学思维都是概念思维。翻译思维作为科学思维的分支之一
人类语言中词语无精确边缘,即都属于“模糊概念”。1965年美国控制论专家扎德首先提出用数学方法来研究模糊现象,创立了模糊集合理论(Fuzzy Sets),并率先用“Fuzziness”表达作
“是N1V的N2”是现代汉语中常见的语法序列式模式,其内部的结构关系、语义关系十分复杂,部分能够进入该序列式的短语有歧义。本文根据对口语语料的观察,试图从句法、语义、歧义
本论文论述了先秦文献通注的问题,并对《论语》做了通注。全文分为两个部分,一、前言。论述了通注的概念。通注,是指对重要的某一特定的文献的所有语词,用现代汉语进行逐一的注释
Translation studies are of wide range and many subjects are adapted. The present essay is mainly to discuss the requirements for the translator and to find out
本文从篇章的角度分析汉语对话语体中的复用现象。本文以小三角为主要研究思路,对复用现象进行了较为详细、深入的思考和研究。语言交流当中复用现象是较为普遍的。复用是指在
知青一代有强烈的身份认同意识。在一定程度上,知青文学参与了这一身份的建构。知青作家通过伤痕/苦难叙事和理想/英雄叙事,建构起知青的基本身份特征。知青身份建构是知青作
词典是最常用的工具书,其基本功能是给出词或词组的释义。选择不同释义方式会给词典及语言学习者带来不同的影响。因此,研究适合不同词典的释义方式和不同释义方式对语言学习者
<正>媒体隔三岔五就曝光拥有几十套、上百套房产的"房姐"、"房婶"、"房叔"的信息,赚足了眼球,也引发人们的深层次思考。这样的事在古代是不可想象的。古代中国历朝历代大多严