基于Kinect辅助的机器人带噪语音识别

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:RockyZhang111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音视频信息融合可以提升机器人在噪声环境下的语音识别性能。然而受说话者的头部旋转、唇部尺寸不一、距摄像头距离不固定以及光照等因素影响,唇部信息不能得到有效的全面表征。该文提出融合机器人与Kinect的多模态系统。该系统采用Kinect获取3-D数据和视觉信息,并使用3-D数据重构侧唇来补充音视频信息。一系列基于特征融合和决策融合方法的结果表明:该文提出的多模态系统优于基于音视频单流和双流的语音识别系统,能够辅助机器人在自身噪声环境下的语音识别。
其他文献
分析了施工企业在跨国施工中,关税及其变化对国际工程项目成本的影响,并提出防范和控制的具体措施。
针对新一轮资产经营责任制的新形势,围绕"强化集中归口、规范物资管理",阐述了沈阳铁路局下一步加强物资管理工作的新思路.
简述汽车轻量化技术的途径和基于JSTAMP/NV的仿真流程,针对目前汽车轻量化采用的激光拼焊、液压成型和热冲压成型等3种主要的先进加工制造技术,以车门内板、副车架和汽车B柱
讨论电子商务B2C模式下实现铁路客运行包配送服务的可行性与实施方案,并就多种可行方案进行比较分析.指出它在改变我国铁路行业的传统服务模式、加速国有企业e化进程中的重要
<正>绘画,是一种艺术实践活动。它是运用线条、色彩、造型和构图,依据一定的形式法则进行搭配组合,完成传达精神内涵的任务。写实、写意,正是人按照不同的美的
中文名称:《战火:红色警戒》  开发厂商:战火工作室  代理厂商:游诚时代  游戏类型:MMORPG  官方网站:http://www.fireol.com    (接上期)    丛林巨猿    当玩家的等级上升到34级后,不光在军需官斯加那里有让人心动的任务出现,在结棘丛林的希卡德那里,还会出现34级的支线任务——巨猿的獠牙。这个支线任务是杀掉丛林巨猿,得到他们的獠牙。此任务难度不高,既可以组