论文部分内容阅读
智能语音技术是人工智能领域发展最为快速的技术之一,也是近年来国内外研究的热点。本文以智能语音技术应用为背景,借助成熟稳定的新型机器人操作系统(ROS),以智能车为硬件平台,设计出一套基于ROS的智能车语音控制系统解决方案。本论文对语音控制技术进行了一定的研究,通过对本系统设计中所需要的技术进行分析,确定了该智能车系统的具体功能。根据智能车系统的发展趋势和语音识别的难点确定该系统的设计需求和目标,并在此基础上完成系统的整体设计和硬件方案的选型。针对复杂工业生活情境下各类噪声对语音识别的污染问题,引入了语音增强技术。进而对语音增强的算法进行比较,分析维纳滤波增强和广义旁瓣抵消器增强的优缺点,选择基于后者的语音增强方式。同时针对传统广义旁瓣抵消器性能受到散漫噪声影响的缺点,提出了一种基于GSC结构的可调延迟矩阵方法。根据仿真效果和软件实测结果可以得出,在不同类型和强度的噪声干扰下,该方法在保持一定语音质量的同时,能有效提高语音识别率,具有良好的性能。最后对系统软件进行设计,完成相应的功能:按照软件开发流程在树莓派上搭建Ubuntu系统,然后配置机器人操作系统ROS的开发环境。将采集到的多通道语音信号传送到语音增强节点进行语音增强与降噪处理后,基于科大讯飞语音识别SDK开发的语音识别节点接收语音并将其识别为文本,该节点通过话题的方式发布指令。语音控制节点通过订阅这个话题接收相应的语音控制指令,以完成对机器人的控制。仿真结果表明,改进后的GSC广义旁瓣抵消器在散漫噪声的影响下具有良好的滤波效果,比传统的GSC算法性能更好。测试软件的总体和各功能节点,结果表明该智能语音控制系统能够实现语音识别、增强、控制等功能。相比于单麦克风方案,该方案语音识别率高,语音质量较好,语音控制指令更灵活,智能化程度高。