论文部分内容阅读
语言模型的效果关系到电力调度语音识别系统的识别准确性.为了提高电力调度语音识别的精度,提出一种基于双字典(通用字典和电力调度领域词字典)的类标签语言模型,该模型以n-gram语言模型为基础加以改进并添加类标签信息,进而提升电力调度语音识别的准确性;同时提出了一种基于双字典的分词、词性标注的联合系统,用于语料的分词、类标签标注任务,从而提高基于双字典的类标签语言模型对电力调度语言的适应性.最后,在采集到的电力调度指令集上对所提语言模型和常用统计语言模型进行了对比实验.此外还通过实验对联合系统和其他分词、词性标注系统进行了对比.仿真结果表明联合系统的分词、词性标注效率更高.考虑了语义信息、字典、分词和词性标注系统等综合因素的类标签语言模型在电力调度语言识别的准确率更高,词错误率只有4.14%.