论文部分内容阅读
机器人听觉感知系统作为人机交互与环境感知的重要手段,可以与视觉感知方式配合使用,以弥补视觉感知的局限性,如受光线条件限制和障碍物阻挡影响等等,因此有了更广泛的应用。作为声源目标定位最核心的评价指标——定位精度,也便成了听觉感知系统要研究的关键问题。定位精度的影响因素众多,主要包括环境噪声的影响、麦克风阵列的实际安装位置和定位计算模型的合理性。针对提高定位精度这一基本问题,本文在噪声存在的前提下研究了基于声达时间差方法的声源目标定位问题。主要进行了以下三方面的研究工作:(1)对传统的时延估计方法进行介绍,并分别对采用四种不同加权函数的广义互相关方法进行仿真实验和性能分析。由于实际环境中存在噪声,特别是非线性噪声,为提高声信号采集的信噪比,本文提出了一种基于LM-BP神经网络的非线性噪声消除方法,以Volterra滤波器为参考模型,对其进行训练,最终通过对噪声滤波,提高了信噪比。最后将本文提出的非线性噪声消除方法与广义互相关方法相结合,提出了基于非线性噪声消除的广义互相关时延估计方法,并对该方法和基本互相关、广义互相关方法进行仿真实验。仿真结果表明,该方法具有更好的抗噪声性能,且性能恶化速度降低。(2)在假定声源目标为远场信号的前提下,根据正四面体麦克风阵列结构和声音传播模型,构建了一种几何定位计算模型,并进行推导,最后进行了水平角和俯仰角误差仿真实验。仿真结果表明,随着声源距离的增加,水平角和俯仰角误差变小。(3)针对实际麦克风阵列与理想麦克风阵列存在差别的情况,本文提出了一种正四面体麦克风阵列标定方法。将距离已知的声源进行多次移动,得到多组测量数据,根据数据估计麦克风位置。该方法只需测量声源的距离,使用LM算法对数据进行处理。仿真实验结果证明,该方法具有很好的标定结果。