论文部分内容阅读
语音信号处理主要包括三个部分:语音识别、语音编码、语音合成。在语音编码这个领域,现在的研究集中在低速率语音编码器方面,本文的目的就是进行低速率语音编码器算法的研究。
本文第一章介绍了语音编码技术的分类、发展和应用。首先简要的介绍了语音编码器的一些基本概念。文中详细介绍了语音编码器的性能评价,因为它是今后我们设计语音编码器的性能优劣的评判标准。接着介绍了几种已经成为标准的语音编码器。
在第二章中,我们首先介绍了三类主要的语音编码方法:波形编码、参数编码、混合编码。其中,混合编码是近年来的主流编码器。所以针对它,我们详细的探讨了它的核心技术。首先是利用线性预测(LP)对语音进行去相关处理。其次是VQ技术,对参数进行合理的压缩。另外,利用感觉加权滤波器来合理利用人的感知特征进行量化噪声的分配。最后,针对迄今最为成功的混合编码器,CELP编码器,我们分析它的各个组成部分。通过采用LPC分析,去除了语音信号的短时相关性,通过获取基音周期来去除语音信号的长时相关性。基音周期在编码器中反映为自适应码矢量。自适应码矢量和固定码矢量构成语音编码器的激励信号。CELP编码器通过采用分析/合成结构来进行自适应码矢量和固定码矢量的选择。另外,快速搜索算法也是CELP成功的关键。
由于LSF参数在语音编码器的重要性,第三章专门针对LSF参数的矢量量化进行讨论。提出一种多级量化LSF参数的方法。针对这个新算法,进一步提出了优化量化的方法以及性能分析。优化算法减少了矢量量化算法的运算量和运算时间,加快了矢量量化的编码速度,且对矢量量化的失真情况没有影响。
在第四章中,介绍了MELP编码的基本原理和关键技术,并把利用滤波器相似度确定一些帧不传送LPC系数以及分类的LPC系数矢量量化方法引进到MELP语音编码方法中,有效地降低了计算复杂度,较好的解决了量化码率与量化质量的矛盾,进一步降低了码率和减少了码本的存储量与计算的复杂度。在改进MELP中引进的两种方法同样也适用于其他基于LPC的合成-分析语音编码。