论文部分内容阅读
计算机语音录入技术是一门综合学科,目前正逐步替代现有的键盘和手写板输入成为信息技术中人机接口的关键技术。语音录入技术能够使人们抛开键盘、手写板直接将说出的话转换成汉字在计算机显示器等终端显示设备上显示出来。语音录入技术的研究与应用已经成为继语音识别技术研究之后的又一个具有竞争性的新兴高技术产业。
本文通过对现有语音录入系统的分析,围绕字多音少的问题展开研究。统计语言模型中的二元文法模型可以满足语音录入的基本要求,如再辅以一元文法和三元文法模型,则可以很好的解决音字转换中的字多音少问题。另外,语料库的建立问题也是本文所要考虑的重点问题。语料库建立的结构和查询需要和音字转换算法相结合,最终得出录入文字。基于上述问题的考虑,本文提出相应的解决方法,从而形成一整套的语音识别、转换和输出的系统。