移动设备平台上英语口语学习中的语音识别技术

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yanzi841213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技进步和经济的飞速发展,全球智能手机终端性能的极大提高,各大手机厂商纷纷加大智能手机平台的软件开发,各种语音手机也纷纷出现。但是一般手机的语音识别都是为用户提供人际交互方式控制手机的功能,针对英语学习需求的应用研究和开发还是比较缺少。在目前利用英语进行口语交流越来越多的环境下,利用智能手机的便携终端,给用户提供不受时间、地点和教师资源限制的智能英语学习系统,将会为用户提供更好、更快的电子学习手段。目前已有的基于PC的智能英语学习软件,已经能提供基于计算机辅助学习技术,让学习者及时得到发音质量评分的智能化功能。若要将此类软件移植到手机平台上,将要受到手机运算速度、存储空间量和总线带宽等因素的限制。针对嵌入式系统的软硬件限制,本文研究了一套在手机平台上基于连续语音识别技术的英语学习系统。该系统利用语音识别技术对学习者发音质量进行有效评估,反馈给用户发音信息,系统开发以卡内基梅陇大学的SPHINX为整个系统核心的识别引擎,该引擎在大词汇量、连续读音识别方面具有优势。实验发现,语音识别过程中,高斯计算以及Viterbi路径查找所消耗的时间最多,因此,本文抛弃一般语音识别算法所用的连续型隐马尔可夫模型,而使用半连续型隐马尔可夫模型,使得识别过程减少大量的高斯计算所消耗的计算量。另外根据英语口语发音学习的特殊应用,以学习句子作为先验知识,在识别过程中进行剪支,只识别所读句子,使得搜索空间大大减少,这也使得系统响应时间大大缩短。最后本文进行实验对比PC平台系统模型以及本文提出的系统各自在手机平台上的性能及准确率的表现,得出结论是,运用半连续型隐马尔可夫模型的系统在丧失少量识别精度的前提下,大大提高了运行速度,以适合在手机平台上使用。
其他文献
该文紧紧围绕通用CSCW平台这一主题,按照从分析、设计到实现及验证的顺序展开研究和讨论.首先,该文对各种CSCW关键技术进行了研究和分析,概括总结出各个部分有益的研究成果,
为了同时支持多媒体实时传输以及Web浏览等多种应用程序,必须设计一种数据包调度算法,使其同时支持分层连接共享服务、实时服务和优先级服务.数据包调度通过对数据包进行排队
作为严格基于物理模型的渲染方法(PhysicalBasedRendering),目前已有的多种全局照明(GlobalIllumination)算法可以大大提高三维渲染图像的真实感,并且已经广泛应用于照明工程领
吉化污水处理厂二期改扩建采用了英国欧陆ETWORK6000集散控制系统,此系统对污水处理工艺流程中的28个调节回路进行控制。为了便于操作员监视和调节,建立两个分组画面,每个画面设
随着计算机网络的飞速发展和网上交易、生活的日益普及,网络的安全成为了一个焦点问题。而防火墙为网络安全解决方案中的重要组成部分日益显得重要,现在市场上已经有了许许多多
煤与瓦斯突出是发生在煤矿井下的一种极其复杂的动力现象,是煤矿生产中的主要灾害之一。煤与瓦斯突出灾害不但造成了惨重的人员伤亡,而且使矿井损毁非常厉害,被公认为是严重
随着计算机网络和数字多媒体技术的迅速发展,各种形式的数字视频作品(如DVD、VCD等)可以方便、快捷的在网络上传输,为创作者和使用者提供很大的便利,然而也为非法使用者提供
3S技术是数字地球重要的技术基础,所谓3S技术是指全球定位系统(GPS)技术,航空航天遥感(RS)技术和地理信息系统(GIS)技术以及这三种空间信息技术的集成.该论文只讨论3S之一的RS和计
该文着重研究了一个基于INTERNET的远程教育系统的实现以及其中涉及到的关键技术,包括XML、分布式处理等.在论文中着重描述了为保证系统具有良好的可扩展性和较高的效率而设