论文部分内容阅读
根据语音信息实现对当前说话人跟踪的语音定位技术在视频电话会议、大型会议场所记录、语音识别预处理装置、助听设备等场合具有广泛的应用前景和潜在的经济效益。由多个麦克风组成的阵列在时域和频域的基础上增加了空间域,使得麦克风阵列的语音定位和跟踪方法逐渐成为了一个研究热点。然而,由于实际环境的复杂性和语音信号的特殊性,现有的方法在定位精度、跟踪实时性、可行性等方面都存在不足。本文从实际应用背景出发,研究麦克风阵列的语音定位和跟踪方法,旨在实现一种能够应用于实际环境的语音跟踪系统。
本文设计了一种基于实时信号采集的多通道语音采集系统,搭建了语音信号处理系统的硬件平台,为语音处理算法的分析研究提供了良好的硬件环境。文中对语音信号时延估计方法进行了较深入的研究,提出了一种去混响的预滤波处理方法提高了广义互相关时延估计法在强混响环境下的时延估计性能,提出了一种接收信号正负延迟的判决准则,提高了自适应时延估计法在正负延迟情况下的时延估计精度,扩大了其时延估计范围,期间设计了一种基于LabVIEW的LMS自适应滤波器,实现了两路语音信号之间时延的实时估计,能应用于实际环境中语音信号的实时分析和处理。同时,深入研究了基于时延的几何定位方法,对线性阵列、三角阵列和平面四方阵列作了详细的理论推导和精度分析,分析比较了各阵列的优缺点,提出了相应的改进方案。最后,提出了一种应用于小型室内会议场合的语音实时跟踪系统,详细阐述了其应用方案和实现步骤,通过在实际环境中的测试,分析了误差产生因素中采样频率、阵元间距和信噪比之间的关系并给出了理论证明,从而优化了系统参数,使其具有较好的定位精度。
文中的实验结果都是结合硬件平台对实际语音信号研究分析得到的,所以无论是改进方案还是设计的应用系统,在实际环境应用中都取得了良好的效果,具有一定的实际意义。