论文部分内容阅读
作为三维(Three Dimension,3D)音频主流技术之一——Ambisonics声场重放技术,因其采集和重建过程相互独立,为多数研究员所推崇。基于球谐函数展开可以对目标声场进行分解与重构是Ambisonics声重发系统的理论基础,且重放准确度与球谐函数阶数成正相关性。然而,在声场录制过程中获取声场的高阶Ambisonics(Higher Order Ambisonics,HOA)声场系数所需要的麦克风数量是相当多的,尤其是在重放高频大区域声场条件下。基于此,本文结合压缩感知思想对Ambisonics声场重放进行深入研究,实现麦克风系统的精简,并将其应用于混响条件下声场重放中,尤其是房间内声传递函数(Acoustic Transfer Function,ATF)的测量上。本文的研究工作主要体现在以下三点:(1)本文对基于Ambisonics的3D声场重放方法进行了深入研究。基于两种常见的3D声场重放方法包括模式匹配法和连续扬声器阵列假设法,本文给出了扬声器激励信号的详细推导过程及一般表达形式,实现了3D声场的准确重放。在模式匹配方法的基础之上,针对求解扬声器激励信号时欠定方程组求伪逆引起的听音区边界重放误差急剧增大的问题,结合稀疏分解算法,本文提出了一种基于稀疏表达的Ambisonics的3D声场重建优化方法,避免了矩阵求伪逆导致的病态问题,从而降低了重放区域内的声场重放误差。(2)本文提出一种自由场下基于稀疏表达的HOA声场录制方法。HOA声场录制系统的关键在于拾取给定声场的谐波成份,即声场系数,根据Ambisonics理论基础,声场系数可以根据球麦克风阵列采集到的声场声压计算得出。然而,阵列中有限的麦克风数量限制了其所能准确录制声场的声源频率及声场区域大小。另外,分析了贝塞尔零值对声场录制的影响。本文根据声场的一般模型,声场在源域具有稀疏性,应用稀疏分解算法,得到球谐函数的稀疏表示形式,然后将声场系数上采样至高阶,从而实现减少所需麦克风数量的目的。(3)本文提出一种混响下基于稀疏表达的3D声场重放方法。在实际场景中,混响是一个不可避免的问题,由于ATF随着声源与接收点位置的变化而快速变化,测量混响房间内ATF是一个相当繁琐的过程。另外在测量过程中最关键的问题是如何利用有限的麦克风来获取ATF的高阶球谐函数系数,同时,测量设备的噪声也是影响ATF准确测量的一个重要影响因子。本文基于ATF的一般模型,假设ATF在源域是稀疏的,利用压缩感知技术获得高阶ATF系数,并在从中降低了贝塞尔零值对测量稳定性的干扰。实验结果表明,首先,本文提出的基于稀疏表达的Ambisonics声场重放优化方法,解决了扬声器激励信号求解时矩阵求伪逆引起的听音区域声场重放误差增大的问题,扩大了有效听音区范围。其次,自由场下基于稀疏表达的Ambisonics声场录制方法能够在保障录制准确度的条件下,大幅度减少了所需麦克风的数量并降低了贝塞尔零值的干扰。最后,本文所提出的基于稀疏表达的ATF测量方法一方面能够减少所需麦克风数量,另一方面可以降低设备噪声对测量的影响,具有更好的测量稳定性。