论文部分内容阅读
我国地域辽阔、民族众多,在各民族人民进行信息交流过程中民族语言是最重要、最方便和最常用的一种形式。随着信息技术的发展,数字化的语音在人们的生活中的使用日益普及,人们对数字语音信息的获取、加工和处理提出了更高的要求。语种识别(Language Identification,LID)(?)(?)目的是,利用计算机分析某说话人的语音,然后判断该语音属于何种语种。本文基于少数民族语种识别数据库及WEKA平台,采用多特征参数和多种分类器,探索提高识别率的方法。论文的主要工作包括:1.分类器选择实验:首先从语音波形中提取SDC声学特征参数和音频率F0特征参数,然后编写程序把参数转换为WEKA软件所支持的格式,最后分别利用NaiveBayes (NB)、LISVM、MultilayerPercettron (BP)、RBFNetwork (RBF)、J48等5种分类器进行语种识别训练和测试,分别给出测试结果。实验结果表明,LISVM和RF两种算法具有较好的性能。2.研究SVM核函数对语种识别结果的影响。实验结果表明,利用SDC声学特征参数,在LISVM分类器中采用nu-SVC模型,则其识别率可达98.8%。3.基于基音频率FO特征参数,进行随机森林(RF)与其他分类器的对比实验。实验结果表明,分别对于男、女数据集随机森林分类器的识别率最高可达100%,但对于男女混合数据集,其识别率相对较低。4.在实验的基础上探讨了训练样本数对语种识别结果的影响。无论C-SVC模型或是nu-SVC模型,训练数据越多,识别率也越高,有利于判决,其中nu-SVC模型的识别效果最好。尽管随机森林在多种分类器中的识别率是最高(100%),但把任一个语音数据分成一个训练文件和一个测试文件时,其识别率也会明显下降。