基于子带的三維音频对象空间参数动态量化技术

来源 :武汉大学 | 被引量 : 1次 | 上传用户:gyk0088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着三维视频的发展掀起巨大热潮,三维音频也受到广泛关注。真正的三维音频系统能够重建水平方向、垂直方向和距离三个维度上的三维空间音效,使得声像能够出现在人耳感知的三维空间中的任意位置,实现全方位的沉浸感与包围感。随着国内外三维音频标准化工作的相继展开,三维音频已成为多媒体领域研究的前沿热点。三维音频根据编码对象的不同可以分为多声道三维音频和面向对象三维音频,后者可以允许用户针对特定音频对象或背景声的存在与否、音量等进行调整,满足用户的个性化的交互需求。AVS组织提出三维音频编解码系统要能够支持64个对象的三维重建。然而随着对象数目的增加,边信息码率将会线性增加,甚至远远超过下混声道。为了解决这个问题,本文利用对象在三维空间中的空间位置,基于对象三元组空间参数提取方法,提出了基于子带虚拟声源的空间对象参数动态量化技术。(1)基于局部空间约束的空间参数动态量化编码。现有空间音频对象编码针对每个音频对象提取一组参数,且量化码本局限于参数本身的数据统计特性,设计非均匀量化码本,仅从数据分布层面去除冗余,导致随着对象数目的增多,空间参数编码码率随之线性增加。针对该问题,本文基于人耳对声源的空间方位敏感特性,生成三维空间位置量化矢量码本;将现有的两组对象间的提取一组空间参数的方法,改进为三组对象间提取一组二维空间参数的方法;利用三元组对象所产生的虚拟声源位于这组对象所包围的区域中这一约束条件,生成局部三维空间矢量量化码本。该方法能够在保证对象重建方位和音质相当的情况下,大幅降低码率。客观实验表明,相比于MPEG的SAOC中空间参数量化编码方法,所提出的基于位置约束的空间参数量化编码码率能够平均降低32%。(2)基于三维空间参数的频域子带动态划分方法。为了达到码率与音质之间的平衡,需要进行子带划分,通常认为一个子带内人耳只能感知到一个虚拟声像。现有的频域子带划分都是基于人耳耳蜗对频率感知特性来进行的,由于人耳对低频成分感知敏感,对高频成分感知不敏感的感知特性,对低频子带进行粒度精细的划分,对高频子带进行粗粒度的划分,并未考虑对象间空间参数对子带划分的影响。本文基于标准测试序列所提取出的空间参数,对空间参数进行聚类训练,通过筛选得到子带划分库;为待提取空间参数的对象频谱在子带划分库中选取适合的子带划分,并在子带内提取空间参数。在保证相同码率的情况下,实现重建音频空间方位与音质的提升。
其他文献
公司是市场经济中的重要成员之一,随着经济的发展,以及公司中所有与经营分离体制的需要,公司的经营管理人员需要被监督和制约。监事会作为公司内部的专门监督机构,负责监督公司董事以及高管的经营行为,可依据股东的申请,提起代表诉讼,对公司的利益进行救济。但在实际的运作中,监事的这一项监督权并不能得到很好的适用。文章第一部分从现有的监事会代表诉讼制度存在的困境入手,讨论了关于立法以及实践中所存在的困难。我国监
油菜素甾醇类化合物作为第六类植物激素,对植物的生长发育起着很重要的作用。如促进细胞的伸长与分裂、提高作物的产量品质、增强植物的抗逆性、调节五大激素的平衡、降低农
本论文合成的七元环骨架是一种7H-二苯并[b,d]氮杂(艹卓),是一类重要的中型氮杂环骨架,它存在于多个具有重要活性的中间体中,通过修饰,它可以转化成具有生物活性的、结构更为复
本文基于固结-蠕变理论,分析了软土地基沉降机理,并从实际项目出发,对堤防进行沉降变形监测,并对数据进行深入分析,掌握堤防沉降过程及沉降变化规律。通过钻探取芯取样进行室
公司的投资行为是公司经营过程中的关键环节,投资决策的有效性和正确性直接影响着企业的生存和发展,并对企业资源配置的高效性与股东财富产生影响。然而资本市场中普遍存在着委托代理问题和信息不对称问题,两者导致我国非效率投资行为频繁发生。已有研究证明,高质量的会计信息可以通过定价功能和治理功能,吸引外部投资者,减少融资约束,降低融资成本,缓解投资不足;还可以提高对管理层的监督与制约力度,降低代理成本,抑制过
视频转码是一种将已压缩的视频数据从一种类型转换为另一种类型的技术,广泛应用于视频会议、网络直播和远程教育等方面。由于视频在接收、传输或者存储的过程中,往往会受到外
材料的原生成分和结构以及测试参数都会影响综合性能。本论文以La-Co-Al、Zr-Cu-Ni-Al金属玻璃薄膜为研究模型对纳米压痕实验中加载速率对力学性能的影响进行了详细分析,并对这两种成分的薄膜进行了比较研究。另外以Zr-Cu-Al-Ti金属玻璃薄膜为研究模型探索磁控溅射过程中基底温度对结构和性能的影响。本论文进一步揭示了加载速率、成分和基底温度对金属玻璃薄膜综合性能的影响,有助于未来再深入研究
水稻是世界上最重要的粮食作物之一,对高产品种产量性状的解析在保证粮食安全上有重要意义。水稻产量三要素为有效穗数、每穗粒数和千粒重。内2优6号是一个高产优质的三系超
近年来,延长治疗性抗体半衰期已成为抗体工程改造的重点。抗体半衰期的延长不仅可以提高药效,减少给药频率,而且可以降低治疗费用。利用Fc基因改造以提高抗体和人新生儿Fc受
量子理论的发展衍生了基于量子概率构建语言模型的研究,有学者提出量子语言模型(QLM)并将其应用于信息检索任务中,该模型利用量子理论中的密度矩阵建模句子中的词项依赖。近