低码率音频编码研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:twpt168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究并实现了一个用于可伸缩感知音频编码的信号模型,并对其进行优化,提出了一种由正弦+瞬态+噪声(Sines + Transients + Noise, STN)组成的信号自适应的混合模型。该模型非常适合码率和音质可伸缩编码的音频应用,实现对CD 音质或FM音质从低到中码率的编码和传输,比如6 到64千比特每秒(Kbps)。本文提出了一种基于感知信息提取STN 模型参量的算法。该算法基于共轭匹配跟踪(conjugate matching pursuit) 算法和交叠相加的分析综合法(analysis-by-synthesis overlap-add)。通过计算时变输入信号的心理声学参数,用信号的掩蔽值对匹配跟踪矩阵进行加权。该算法可以准确提取对人的听觉最重要的STN 元素,在面向极低码率应用时这一特点更突出。本文提出了一种新方法实现STN 模型中瞬态信号处理和预回声控制。该方法依赖于STN 正弦模型,因此,它避免了使用滤波器组或其他非参数算法来描述瞬态信号,而后者的若干方法一般都是码率较高的。同时,本文提出的方法可以有效的减小预回声噪声。在研究算法的同时,本文针对此STN 模型提出一套编解码方案。该方案利用STN参数的长时相关性,通过STN 参数轨迹链实现了高的编码增益,同时该方案具有很高的抗丢包鲁棒性。非正式主观听力测试表明,本算法在高码率应用优于变换编码(transform coders),在低码率优于参数编码器(parametric coders)。本文提出的STN 算法构筑了连接低码率低音质参数编码器和高码率高音质变换编码(通常由严格抽样的完全重建滤波器组来实现)之间的桥梁。而且,本算法的STN 模型可以在编码域(coded domain) 实现高质量的时间尺度或基音尺度的调整(time-scale and pitch-scale modifications)。
其他文献
7月6日至8日,中铁十九局集团有限公司承建的朝凌客专项目先后贯通两座高风险隧道—西营子隧道和巴图营隧道。经业主、监理现场检测,两座隧道内实外美,品质优良。尤其采用的喷
2020年是全面建成小康社会的攻坚年,也是“十三五”规划的收官之年。但疫情全球肆虐及贸易摩擦加剧给我国经济目标的实现带来巨大挑战。建筑业作为国民经济的支柱产业,其发展
<正>在城市中建设地下综合管廊的概念起源于19世纪的欧洲,首先出现在法国。自1833年巴黎诞生了世界上第一条地下综合管廊系统后,迄今已经有180多年的历史。法国巴黎1833年就
衡量一个国家的经济发展程度,要从其社会生产的各个方面去考察,要看各项生产能力的综合效果。为了客观、科学地分析我国的经济发展状况,本文从诸多经济指标中选择20个引入评
通过3次雷击事故分析防雷设施在雷击过程中发挥的作用。