基于分布式语音识别的语音浏览器研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:regrgdgdgg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以分布式语音识别为主线,对分布式语音识别的理论与方法、分布式语音识别在基于VoiceXML的语音浏览器中的应用,以及分布式语音识别服务等问题开展了研究.该论文的研究工作主要集中在以下几个方面:(1)研究了语音浏览器技术的发展,以Internet2中交互式语音应用的核心技术为目标,提出了基于分布式语音识别的语音浏览器的概念,通过把分布式语音识别技术和VoiceXML解释器网关结合,解决语音浏览器存在的识别质量差、效果不稳定、缺乏对无线数字网络的支持等问题,将语音浏览器扩展的应用范围扩展到了基于语音的设备上,实现"人与网络的自然对话".(2)通过对相邻特征帧之间相关性的研究,提出了DSR特征向量自适应码率编码机制,利用基于小波分解和SPHIT编码的压缩机制,达到较高的压缩比.而且编码具有渐进性,可以根据网络状况变化编码速率,使码率具有自适应性.(3)提出了对DSR流的信源-信道联合编码方案,利用RS编码的较强的纠错能力对生成的DSR流进行冗余编码.仿真结果显示我们的可伸缩的DSR编码器能够在压缩率和健壮性之间取得很好的平衡.(4)提出了TCP友好的DSR传输协议,包括TCP友好的拥挤控制机制和DSR码流的自适应速率控制机制等.仿真结果显示该协议可以有效地用于分布式语音识别系统中,比TCP协议更高效.(5)讨论了基于VoiceXML的分布式语音浏览器系统的模型—NKDVB的系统设计方法和实现中的部分关键技术,给出了系统实现的框架和模型,并对系统进行了分析和评价.(6)将分布式语音识别技术和Web Services技术结合,提出了分布式语音识别服务的概念,并给出了实现模型,从SOAP、WSDL和UDDI三方面实现了分布式语音识别服务的框架.
其他文献
该文深入的研究了蚁群算法,将蚁群算法用来解决固定货架堆垛机拣货过程中的TSP问题,大大缩短了堆垛机的拣选路径;并且针对蚁群算法运行速度比较慢的问题,对现有的蚁群算法做
最近,语音识别、手势识别等新的人机接口技术的研究受到了广泛的关注.该文主要研究了基于视觉的手势识别系统的关键技术,并用于人与仿人型机器人之间的交互.该文首先对基于视
该论文在企业资源计划ERP理论基础上主要论述了半导体制造业ERP系统中主生产计划和物料需求计划的研究与系统实现.论文首先讨论了MRP,MRPⅡ和ERP的发展与应用以及企业资源计
近年来,环境问题引起了世界各国的关注。作为空气污染的主要来源之一,易挥发有机物(VOCS)不仅是一次污染源而且还可能造成光化学烟雾等二次污染。因此,控制大气中挥发性有机
车辆调度问题是物流调度问题中的一个典型问题,其中研究的最多最具有代表性的问题就是车辆路径问题(VRP)和有时间窗的装卸货问题(PDPTW).车辆路径问题(VRP)是用来为一些有最
该文以上海市科技兴农重点攻关项目"现代温室主要蔬菜标准化栽培管理计算机辅助决策系统的建立和应用"为背景,对农业专家系统的实现进行研究.该项目旨在开发出适合中国国情的
随着科学技术的进步,当今的控制工程技术中面临着一大类复杂控制系统.在这些控制系统中,即有系统行为和特性方面的复杂性,也有不确定性导致的复杂性,同时还有多模式集成和控
该文首先综述了机器人足球的历史以及发展状况,并预测了机器人足球运动的未来发展方向.随后,以人工智能发展的历史为线索,阐明了当前足球机器人Agent所面临的主要研究问题.从
该文主要研究了基于组件化的软件分析和设计过程中存在的问题,并结合设备管理开发的实例阐述了如何解决这些问题.在设备管理业务流程分析中,着重论述了业务流程分析的目的和
神经网络技术是20世纪末迅速发展起来的一门新技术。由于神经网络具有良好的非线性映射能力、自学习适应能力和并行信息处理能力,为解决未知不确定非线性系统的建模和控制问