几种改进的MFCC特征提取方法在说话人识别中的应用

来源 :第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会) | 被引量 : 0次 | 上传用户：wangxiaoyuzhang

【摘要】

：

【作者】

：

许鑫苏开娜胡起秀

【机构】

：

北京工业大学计算机学院,北京,100022 清华大学计算机科学与技术系,北京,100084

【出处】

：

第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会)

【发表日期】

：

2005年11期

【关键词】

：

MFCC 说话人识别特征提取鲁棒性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Mel频率倒谱系数(MFCC)表征了人类的听觉特征.目前国内外提出了一些比较好的MFCC改进算法,可以提高语音特征提取的鲁棒性.本文介绍了一些在语音识别中取得一定效果的Mel倒谱提取的改进算法.将这些算法应用于文本无关的说话人识别,并在此基础上提出了四种改进方法.在100人和200人的电话语料库中,分别进行同信道和不同信道的实验,使识别率获得了不同程度的提高.尤其在不同信道上的识别效果更为显著.其中频率掩蔽滤波与ExpoLog尺度相结合的方法识别效果最好:在用座机语音建模手机语音测试的实验中,识别率从基准系统的16.327﹪上升到38.776﹪;在用手机语音建模座机语音测试的实验中,识别率从基准系统的8﹪上升到40﹪.可见,所提出的改进方法是非常有效的.

其他文献

几种改进的MFCC特征提取方法在说话人识别中的应用

其他学术论文