几种改进的MFCC特征提取方法在说话人识别中的应用

来源 :第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会) | 被引量 : 0次 | 上传用户:wangxiaoyuzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Mel频率倒谱系数(MFCC)表征了人类的听觉特征.目前国内外提出了一些比较好的MFCC改进算法,可以提高语音特征提取的鲁棒性.本文介绍了一些在语音识别中取得一定效果的Mel倒谱提取的改进算法.将这些算法应用于文本无关的说话人识别,并在此基础上提出了四种改进方法.在100人和200人的电话语料库中,分别进行同信道和不同信道的实验,使识别率获得了不同程度的提高.尤其在不同信道上的识别效果更为显著.其中频率掩蔽滤波与ExpoLog尺度相结合的方法识别效果最好:在用座机语音建模手机语音测试的实验中,识别率从基准系统的16.327﹪上升到38.776﹪;在用手机语音建模座机语音测试的实验中,识别率从基准系统的8﹪上升到40﹪.可见,所提出的改进方法是非常有效的.
其他文献