论文部分内容阅读
语音是人与人之间进行高效信息交流的重要途径。为了提高语音传输效率或节省存储空间,通常需要对语音信号进行压缩编码。语音编码技术已在通信网络、消费电子、数字娱乐、国防军事等领域得到了广泛应用。G.722.1语音编码器是国际电信联盟推出的一种低复杂度的宽带语音编码算法,该算法主要采用变换域编码方法,可对300~4000Hz语音和7kHz以内的音乐进行编码;MELP语音编码器是码率为2.4kbps的低速率语音编码器。尽管G.722.1和MELP语音编码器已得到实际应用,但在网络丢包等情况下,其性能明显下降。为了提高编码器的语音质量,本文对G.722.1和MELP语音编码器进行了研究,主要工作如下:(1)基于ITU G.722.1语音编码器,提出一种多描述语音编码方法。该方法应用多描述编码(Multiple Description Coding,MDC)思想,在G.722.1编码器的基础上,构建一个互补编码器;然后在编码端,对同一帧语音分别用G.722.1编码器和其互补编码器进行语音编码;在解码端,在接收到其中任一语音码流时,用G.722.1解码器进行解码,而在接收到两个语音码流时,用G.722.1解码器先分别对两个语音码流进行解码,然后对解码结果进行联合处理,其最终的语音质量有明显提升。仿真实验结果表明,该方法的抗丢包效果明显,语音质量有一定提高。(2)为了提高解码语音质量,给出一种基于LSTM网络的G.722.1编码器后处理方法。该方法利用长短期记忆(LSTM)网络学习G.722.1编码器编码前、后语音倒谱参数之间的关系,然后将编解码后受损的语音输入到训练好的LSTM网络来进行增强,最后将增强的解码语音与原始解码语音进行频域相加处理。实验结果表明,该方法增强了原始解码语音中7kHz-8kHz频带的频谱,改善了解码语音质量。(3)针对MELP编码器,分析了线谱频率、基音周期、残差谐波幅度等编码参数量化误差对解码语音质量的影响,并给出了实验结果,这对改进MELP编码器具有一定指导作用。