论文部分内容阅读
在机器人人听觉系统中,对多目标人类语音声源的方向定位,是语音信号的增强,多声音目标的分离和识别基础,为多感官拟人机器人头部的人机交互方面的发展提供了有力的支持。对声目标的定位和跟踪,广泛应用于军事目标探测,会议录音等领域。本文仿人耳的部分生理特性,建立了声音传播和采集的模型,介绍了主要的定位方法。本文通过对成型波定位方法进行研究,提出了一种改进的成型波定位方法。这种方法通过预先测量无信号时的噪音水平,来抑制某些被噪音干扰较严重的频带;我们分析了回响干扰的特性,利用它的脉冲性和指数衰减性,提出了去除回音干扰的有效方法;另外,我们通过对汉语语音的发音规则进行研究,总结其频率特性,对成型波的定位方法进一步做频域加权,达到了良好的定位效果。我们对多目标的声源定位系统进行了研究。提出了在成型波定位方法基础上的声源分离方法。首先,通过成型波方法搜索空间声波能量,计算得到几个可能目标的方位和数量。然后,通过卡尔曼滤波器,预测目标的运动轨迹,把预报的轨迹与实际计算得到的轨迹相比较,确定目标的同一性。最后,当多个目标在同一个位置重合,其他方法失效时,我们通过对前一时刻声音特征的提取,将处于同一方位的多个声音目标分离提取出,保证对他们的跟踪。综合开发速度成本和功能效用的因素,系统使用三只麦克风布置在机器人头部;在以声音背景为普通办公室环境的实验条件下,可准确跟踪两米以内用较高声量说话的多个移动声音目标。