论文部分内容阅读
在嘈杂的语音通信环境中,由于存在背景噪声和其他说话人的声音,使得感兴趣说话人的声音难以听清,极大地影响了语音通信的质量。随着时代的发展,人们对语音通信质量的要求越来越高,这一问题的解决已迫在眉睫。麦克风阵列的研究,是目前阵列信号处理领域的新兴研究方向,为上述问题的解决引入了新思路。在时域和频域的基础上增加空间域,在噪声处理、声源定位和跟踪、语音提取和分离等方面,弥补单个麦克风的不足。因而,麦克风阵列能够广泛应用于嘈杂背景下的语音通信环境,提高语音通信质量。本文介绍了一种基于麦克风阵列的嘈杂背景下声源定位和语音分离方法,提出了在DSP平台上的硬件和软件实现方案。本文涉及的声源定位和语音分离技术,以麦克风阵列近场语音传播模型为基础。首先,使用频率聚焦技术,形成整个语音频带的频域平均相关矩阵;使用近场宽带2D-MUSIC算法,完成声源的定位和跟踪;再根据估计的方位信息,使用近场最小方差波束形成技术,完成语音的提取和分离。算法实现方案,包括硬件和软件两部分。硬件方面,搭建了以TMS320C6713为核心的通用阵列语音处理平台。软件部分,针对这样一个任务繁多,计算量庞大的算法,进行了软件系统设计和优化。实现的主要难点,包括多个任务的调度、代码优化和麦克风校正等。其中,任务调度对算法各任务进行合理的优先级划分,使系统协调工作。代码优化部分,采用汇编语言与C语言联合编程,使用DSPLIB提高编程效率,以及进行折衷处理,在保证算法实现效果的前提下,尽量提高运行速度。麦克风校正,主要是保证各个麦克风的幅度响应一致,从而保证距离定位的准确性。通过硬件和软件的实现,本系统基本完成了声源的二维定位和跟踪,以及单个声源的语音增强功能,验证了工程实现的可行性。最后,本文对测试结果进行分析,并提出了进一步工作的重点。