数字语音编码算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:weistiger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号处理主要包括三个部分:语音识别、语音编码、语音合成。在语音编码这个领域,现在的研究集中在低速率语音编码器方面,本文的目的就是进行低速率语音编码器算法的研究。   本文第一章介绍了语音编码技术的分类、发展和应用。首先简要的介绍了语音编码器的一些基本概念。文中详细介绍了语音编码器的性能评价,因为它是今后我们设计语音编码器的性能优劣的评判标准。接着介绍了几种已经成为标准的语音编码器。   在第二章中,我们首先介绍了三类主要的语音编码方法:波形编码、参数编码、混合编码。其中,混合编码是近年来的主流编码器。所以针对它,我们详细的探讨了它的核心技术。首先是利用线性预测(LP)对语音进行去相关处理。其次是VQ技术,对参数进行合理的压缩。另外,利用感觉加权滤波器来合理利用人的感知特征进行量化噪声的分配。最后,针对迄今最为成功的混合编码器,CELP编码器,我们分析它的各个组成部分。通过采用LPC分析,去除了语音信号的短时相关性,通过获取基音周期来去除语音信号的长时相关性。基音周期在编码器中反映为自适应码矢量。自适应码矢量和固定码矢量构成语音编码器的激励信号。CELP编码器通过采用分析/合成结构来进行自适应码矢量和固定码矢量的选择。另外,快速搜索算法也是CELP成功的关键。   由于LSF参数在语音编码器的重要性,第三章专门针对LSF参数的矢量量化进行讨论。提出一种多级量化LSF参数的方法。针对这个新算法,进一步提出了优化量化的方法以及性能分析。优化算法减少了矢量量化算法的运算量和运算时间,加快了矢量量化的编码速度,且对矢量量化的失真情况没有影响。   在第四章中,介绍了MELP编码的基本原理和关键技术,并把利用滤波器相似度确定一些帧不传送LPC系数以及分类的LPC系数矢量量化方法引进到MELP语音编码方法中,有效地降低了计算复杂度,较好的解决了量化码率与量化质量的矛盾,进一步降低了码率和减少了码本的存储量与计算的复杂度。在改进MELP中引进的两种方法同样也适用于其他基于LPC的合成-分析语音编码。
其他文献
农作物种质资源是作物育种、生物技术研究的物质基础,是人类赖以生存和发展的战略性资源,是维系国家食品安全和农业可持续发展的基本保证。目前,国内外十分重视种质资源的收
在MMOG(Massively Multiplayer Online Games)中,玩家之间协作和互动使MMOG具有更强的竞争性和趣味性。但是在现有的MMOG中,所应用的玩家联盟策略比较简单,玩家之间通过简单的组
随着Internet的广泛普及和发展,人们在对信息获取快捷的同时也对信息安全访问提出了需求,而访问控制作为防止非法授权访问的一种网络安全手段,被广泛进行了应用。基于角色的
随着互联网数据量呈现爆炸性增长,海量数据的存储和查询给数据中心带来了极大的挑战。MongoDB作为一种新型的非关系数据库,其灵活的数据存储格式和高查询性能使其得到广泛应
僵尸网络是攻击者出于恶意目的传播僵尸程序控制大量主机,并通过一对多的命令与控制信道所组成的网络,实现信息窃取、分布式拒绝服务攻击和垃圾邮件发送等攻击目的。P2P僵尸
计算机数字图像处理技术已经得到广泛应用,本文是将其应用于遥控器生产的一个研究和探索的实例,其中图像分割技术是关键。遥控器面板的智能检测系统,是将原来的人工检测面板
随着科技的发展,出现了大量对计算能力需求很高的应用,而高性能计算机的高造价促使了集群的诞生和发展。集群是以网络技术连接起来的工作站或PC机的组合,它在工作中是一个统
电子商务网站规模的迅速增长使用户无法在海量的数据中快速地发现自己感兴趣的信息,因此如何为提高网站的性能、为用户提供个性化的便捷服务是电子商务网站竞争的关键。作为
图像融合是图像处理中的一个新兴研究领域。其目的是分析每幅待融合图像的特征,采用合适的融合策略对这些特征进行融合,最终得到更符合人或计算机视觉,而且更适合进一步图像
在并行计算领域,互连网络的拓扑结构一直是国际上研究的热点。当前,人们已提出了多种互连网络拓扑结构,其中超立方体(hypercube)是最流行的互连网络拓扑结构之一。它已被应用