论文部分内容阅读
目前的各种语音应用系统都需要纯净的语音输入,然而当这些语音系统在实际使用时,却很难得到满足要求的语音信号,实际的语音信号受到各种噪声尤其是其他语音的干扰。这是限制目前各种语音应用系统的瓶颈,研究和设计能解决干扰语音问题的语音净化系统具有特别重要的意义。然而,消除语音干扰是语音增强技术中的难点,本文利用盲源分离方法,提出基于改进MSICA的语音净化处理算法,并针对实际语音应用系统的特点设计并实现了语音净化处理系统。本文主要有以下的工作和创新点:以盲源分离为手段,研究语音净化算法。在研究几种盲源分离算法的基础上,重点讨论了如何改进MSICA算法,使之能够提取出主语音信号,而不仅仅分离混合语音。主要工作集中在:对输入混合语音利用谱相减去噪滤除非语音信号,从而简化后续盲源分离的计算;提出基于分割谱的排序修正规则,并利用该规则从FastICA分离信号中确定主语音信号,并在时域进一步处理残留的交叉干扰分量,从而解决盲源分离排序不确定问题,改进了MSICA算法。通过仿真结果证明,语音净化处理算法能从含有一个干扰语音的嘈杂环境中净化出目标说话人语音。并且该算法很容易扩展到含有多个干扰语音的场景。
在系统设计和实现方面,提出了语音净化系统的软硬件设计方案,并将该方案应用于车载免提及语音识别前端预处理。主要基于TMS320C6416TEB,研究了语音净化算法的DSP实现及浮点运算的定点实现和优化问题。利用嵌入式操作系统DSP/BIOS设计语音净化软件平台;研究语音净化处理算法在定点C6416DSP上实现的关键技术,以及降低算法复杂度提高实时性的优化问题。在方案设计中,考虑到声源数目的不确定,还设计了可调节多通道的语音采集。
本论文对语音净化理论和实现进行了深入的研究,所提出的语音净化算法、在DSP上的实现以及设计的两个应用具有一定的创新性和实用性。