G.722.1语音编码技术研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:libin101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人与人之间进行高效信息交流的重要途径。为了提高语音传输效率或节省存储空间,通常需要对语音信号进行压缩编码。语音编码技术已在通信网络、消费电子、数字娱乐、国防军事等领域得到了广泛应用。G.722.1语音编码器是国际电信联盟推出的一种低复杂度的宽带语音编码算法,该算法主要采用变换域编码方法,可对300~4000Hz语音和7kHz以内的音乐进行编码;MELP语音编码器是码率为2.4kbps的低速率语音编码器。尽管G.722.1和MELP语音编码器已得到实际应用,但在网络丢包等情况下,其性能明显下降。为了提高编码器的语音质量,本文对G.722.1和MELP语音编码器进行了研究,主要工作如下:(1)基于ITU G.722.1语音编码器,提出一种多描述语音编码方法。该方法应用多描述编码(Multiple Description Coding,MDC)思想,在G.722.1编码器的基础上,构建一个互补编码器;然后在编码端,对同一帧语音分别用G.722.1编码器和其互补编码器进行语音编码;在解码端,在接收到其中任一语音码流时,用G.722.1解码器进行解码,而在接收到两个语音码流时,用G.722.1解码器先分别对两个语音码流进行解码,然后对解码结果进行联合处理,其最终的语音质量有明显提升。仿真实验结果表明,该方法的抗丢包效果明显,语音质量有一定提高。(2)为了提高解码语音质量,给出一种基于LSTM网络的G.722.1编码器后处理方法。该方法利用长短期记忆(LSTM)网络学习G.722.1编码器编码前、后语音倒谱参数之间的关系,然后将编解码后受损的语音输入到训练好的LSTM网络来进行增强,最后将增强的解码语音与原始解码语音进行频域相加处理。实验结果表明,该方法增强了原始解码语音中7kHz-8kHz频带的频谱,改善了解码语音质量。(3)针对MELP编码器,分析了线谱频率、基音周期、残差谐波幅度等编码参数量化误差对解码语音质量的影响,并给出了实验结果,这对改进MELP编码器具有一定指导作用。
其他文献
外科学是医学教育的重要部分,其中手术学尤为重要,它是培养医学生外科基本技能的重要课程,学习期间是学生外科基本功训练的重要阶段.
20世纪20年代前后我国历史上掀起了一场声势浩大的赴法勤工俭学运动,这场运动不仅仅是中法友谊的历史见证,同时也为我国造就了一大批有卓越贡献的革命者和国家领导人,其中包括周
对现阶段短肢剪力墙结构抗震设计方法的研究现状进行了总结.结合工程设计实例分析,阐明了底部大空间裙楼设计、转换层设计、短肢剪力墙的抗震设计要点,提出了短肢剪力墙连梁
学习投入作为一种衡量和预测学生学习状态的指标在学生学业成就和未来发展中都发挥着重大的作用。但随着社会发展和时代进步,初中生承受着来自多方面的压力,焦虑成了学生日常
随着“一带一路”等国家新兴发展战略的提出,刺激了以钢铁行业为首的基础建设资源需求,为钢材打捆机包装市场提供了巨大的发展空间。打捆头是钢材打捆机的核心部件,对打捆头
肺结核是由结核杆菌引起的呼吸系统常见慢性传染病,多在人体抵抗力低下的时候发病。据卫生部有关统计资料显示:我国现有肺结核病人500万,肺结核病人占全球肺结核病人的1/4,居