论文部分内容阅读
语音识别是近半个世纪发展起来的新兴学科,它能使计算机“听懂”人的自然语。由识别得到的信息可作为声控信号应用到多种技术领域,在工业、军事、交通、医学、民用等各方面有广阔的应用前景,蕴有巨大的社会经济效益,它作为高新技术新产业开发受到了世界各国的重视。语音是最符合人类自然习惯的一种通信方式。随着语音识别技术的发展,它在人机接口和多媒体方面的应用也越来越普遍了。在计算机的运算速度和存储能力迅速提高之后,输入输出的人机界面变得越来越重要,人机接口是当前计算机领域的热门课题之一。而语言是人类用来交流最自然、最有效的手段,也是众多载体中具有最大信息量的信号,具有最高的智能水平。一旦计算机具备了这种语言功能,其智能程度与应用价值将大大增加。因为在这种人机交互中使用的是最自然的语言方式来存储和处理信息,是人机交互的一次革命。本文主要是利用微软公司推出的MS Agent在SAPI引擎下进行的二次开发,实现在文本编辑工具(记事本、写字板、word等)中用语音来代替键盘操作,从而使得我们脱离键盘,达到人机交互。本文主要以记事本为例实现Agent动画人物对语音命令的识别和语音输出,即:当说出notepad后,系统即可识别,Agent动画人物以气泡的形式反应出open notepad,之后记事本打开,这时你可以说出open file、print、help等等所有记事本上的命令按钮,这些命令都显示在what can I say对话框中,可以查看这个对话框说出你所想要的语音命令。本文除了可以识别语音命令外,还能够识别26个英文字母和一些简单的英文单词,并且把识别的结果显示在记事本的编辑区中。