基于SAPI引擎的文本编辑工具中语音命令的应用研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:hxg0215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是近半个世纪发展起来的新兴学科,它能使计算机“听懂”人的自然语。由识别得到的信息可作为声控信号应用到多种技术领域,在工业、军事、交通、医学、民用等各方面有广阔的应用前景,蕴有巨大的社会经济效益,它作为高新技术新产业开发受到了世界各国的重视。语音是最符合人类自然习惯的一种通信方式。随着语音识别技术的发展,它在人机接口和多媒体方面的应用也越来越普遍了。在计算机的运算速度和存储能力迅速提高之后,输入输出的人机界面变得越来越重要,人机接口是当前计算机领域的热门课题之一。而语言是人类用来交流最自然、最有效的手段,也是众多载体中具有最大信息量的信号,具有最高的智能水平。一旦计算机具备了这种语言功能,其智能程度与应用价值将大大增加。因为在这种人机交互中使用的是最自然的语言方式来存储和处理信息,是人机交互的一次革命。本文主要是利用微软公司推出的MS Agent在SAPI引擎下进行的二次开发,实现在文本编辑工具(记事本、写字板、word等)中用语音来代替键盘操作,从而使得我们脱离键盘,达到人机交互。本文主要以记事本为例实现Agent动画人物对语音命令的识别和语音输出,即:当说出notepad后,系统即可识别,Agent动画人物以气泡的形式反应出open notepad,之后记事本打开,这时你可以说出open file、print、help等等所有记事本上的命令按钮,这些命令都显示在what can I say对话框中,可以查看这个对话框说出你所想要的语音命令。本文除了可以识别语音命令外,还能够识别26个英文字母和一些简单的英文单词,并且把识别的结果显示在记事本的编辑区中。
其他文献
随着计算机的普及以及互联网的迅猛发展,大量的信息以电子文本的形式出现在人们面前。为了应对信息爆炸带来的挑战,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到
迄今为止,城市电网规划领域仍旧没有一个完整的标准化规范,各电力机构拥有各自相互隔离的系统,造成数据一致性差,需要重复录入数据等问题,形成“信息孤岛”。国内有关电网规划系统的研究也不少,但是大多数都是基于具体的功能而创建的系统,各自拥有自己的数据模式,即不完备也不标准。这就需要有一个公共的数据标准来表示数据,并且提供通用接口规范来满足不同应用程序之间的接口。论文首先论述了面向对象建模技术,分析了各种
过去的半个世纪中,各种新的医学成象方法的临床应用,使得医学诊断和治疗技术取得了很大的进展,如今临床诊断、治疗计划的制定以及评价,都经常需要多种模态图象的支持,这就使得对医
随着计算机应用的普及和软件产业的飞速发展,人们对于提高软件质量的要求也越来越迫切。软件测试作为保证软件质量的重要的手段之一,是软件项目顺利实施不可缺少的环节,且通常会
知识产权保护一直是信息安全领域中数字内容保护的一部分,越来越多有关计算机安全的研究集中到软件知识产权保护方面。随着对知识产权的攻击方法的不断演变,保护知识产权的相应
随着Internet的飞速发展,网络迅速成为一种重要的信息传播和交换的手段。如何通过Internet来把分布在世界各地的异构数据库里的有用数据进行整合和交换并加以综合利用,即构建
目标识别是计算机视觉的一个重要研究方向,在军事,自动化领域有着广泛的应用前景。复杂背景下动态目标的识别更是一个难点和热点。目前关于目标的识别方法已有很多,而对于复杂背
工作流技术是计算机支持的业务流程的全部或部分自动化,目的在于通过对业务工作的流程化分解改造,提高企业运作的灵活性和适应性、优化并合理利用资源,使企业能集中精力处理核心
类推是人类最常用的基本推理过程。图像类推思想是一种基于学习的思想,阐述的是计算机学习人类的类推过程,分析并学习源图像对中两幅图片的关系,将此关系应用到目标图像对中。