基于多核处理平台的HEVC解码核心模块并行处理的算法设计与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户：a1986431230xinglixue

【摘要】

：

【作者】

：

李毅

【出处】

：

南京邮电大学

【发表日期】

：

2021年03期

【关键词】

：

HEVC解码多核处理平台并行处理环路滤波 CTU

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

新一代视频编码标准—H.265/HEVC中引入了很多新特性,这些特性在提升编码效率的同时,也使得相比之前的标准—H.264/AVC,HEVC的计算复杂度变得更高。另外,HEVC标准针对的是高清和超高清视频应用,而这些视频通常含有巨大的数据量,这些因素使得实时处理HEVC标准视频流成为传统单核处理器面临的一大挑战。所幸,HEVC标准在开发时就考虑到了这些问题,提供了很多并行工具,这些并行工具可以缓解计算复杂度高和数据量大带来的实时处理困难。同时,现代处理器从单一内核架构向多核架构发展,也为并行处理算法的实现提供便利。因此,关于HEVC标准的编解码的并行处理算法也成为众多研究者关注的研究对象。本文利用Tilera-GX36多核处理平台,研究基于多核处理平台的HEVC解码核心模块的并行处理算法。论文的研究内容主要包括以下几点:(1)提出并实现了一种基于多线程负载均衡的联合并行环路滤波算法,实现去方块滤波(DBF)和样本自适应补偿(SAO)的联合并行处理。通常,图像中不同区域因为纹理不同,进而对CTU产生不同的划分方式,使得其待滤波边界数目有较大差异。当以CTU为最小并行粒度进行多线程并行时,不同线程的计算负载会出现不均衡现象。针对这一问题,提出了一种区域划分方案,将图像划分为多个区域,每个区域中的待滤波边界数近似。再利用映射关系表,将这些区域分配给多个线程进行并行处理,从而实现各滤波线程间的负载均衡。最后利用缓存技术,将DBF和SAO进行联合,减少两者之间存在的延迟,提高环路滤波整体的并行性。(2)提出并实现了一种基于CTU的HEVC帧内/帧间融合并行解码算法。OWF是以CTU行做为解码并行粒度的算法,会存在由于不同CTU行计算复杂度不同,使得部分帧内解码线程阻塞而产生线程空闲的问题。基于CTU的细粒度波前并行解码方案,可以减少帧内解码线程阻塞的问题,但该方案未考虑帧间CTU解码的并行性。针对这两种并行解码方案尚存在的问题,可以在细化帧内并行粒度的同时,进一步利用了帧间CTU之间的依赖关系,实现以CTU为并行粒度的帧内/帧间融合的并行解码。若当前帧内无CTU待解码时或者存在空闲线程时,空闲的线程可以直接用于相邻帧中满足依赖关系的CTU的解码。从而,进一步减少了线程空闲,提高了多核资源的利用率。(3)提出并实现了基于核心模块融合的HEVC并行解码算法。当将所提出的联合并行环路滤波方案以及基于CTU的HEVC帧内/帧间融合并行解码算法,直接同帧级并行熵解码方案相结合时,并行粒度不同与资源调度会给系统内部带来整体上的延迟。针对这一问题,利用流水线并行技术和分级线程调度策略将三个模块进行融合,减少模块间延迟以及线程空闲时间,提升系统整体的数据吞吐量。之后,利用Tilera多核平台特性,实现HEVC解码的平台优化。实验在Tilera-GX36多核处理器上进行,以libde265作为参考软件,对多种未使用任何并行工具编码形成的高清超高清视频流进行测试。根据实验结果,所提并行环路滤波方案,相比于前人提出的快速融合环路滤波算法,并行性能平均提升了约9.1%;基于CTU的HEVC帧内/帧间融合并行解码算法,相比于OWF和基于CTU的细粒度波前并行方案,并行性能平均分别提升了约18.3%和8.5%;实现的基于核心模块融合的HEVC并行解码算法,相比于细粒度多层次并行解码算法最大并行加速比平均提升了约8.15%。

其他文献

无卤阻燃长玻纤增强聚丙烯复合材料的老化性能研究

本论文通过熔融共混法制备了LGFPP/IFR阻燃复合材料作为研究对象,较为系统的研究热氧老化、紫外老化和自然老化对阻燃材料结构与性能的影响。借助燃烧性能测试、TGA、Cone、S

学位

阻燃长玻纤增强聚丙烯老化机理

非接触电能与信号混合传输系统的研究与实现

非接触电能传输是面向电能传输领域的一项具有重大创新意义的高新科技,已成为现代电能传输领域的一大热点。它摆脱了传统方式下必须通过导线连接的束缚,扩展了电气设备的活动

学位

非接触混合传输全双工调幅调制联合仿真

论WTO体制特殊与差别待遇条款的有效性及其促进发展的机制

如果多边贸易体制能以制度方式顾及所有参与者的需要,那么它的有效运行将无疑为所有参粤者提供美好前景。尽管这一愿景十分诱人-相互关系,互惠和非歧视等基本原则继续保持其

学位

特殊与差别待遇条款发展中国家有效性合法性遵约机制

2DoF直驱感应电机转子损耗计算及降耗措施研究

两自由度直驱电机可实现旋转、直线及螺旋等运动形式,由于省掉了传统的机械转换和传动装置,此种电机具有空间集成度高、控制精度高、检修量小、成本低等优势,在机器人、数控机床、汽车生产线等领域具有广泛的应用前景。本文对一种两自由度直驱感应电机(2DoFDDIM)进行研究,该2DoFDDIM由空间扣合的两个弧形定子及一个共用的镀铜实心转子构成,电机具有结构简单、机械强度高等优势。实心转子表面镀铜是提高电机力

学位

两自由度直驱感应电机损耗计算解析法有限元法降耗优化铜铁合金等效电路

三叶犁头尖生物学性状及繁育研究

本实验采用遮阳网、柴胡、玉米遮荫,观测三叶犁头尖生长发育状况和增产效果,测定不同遮阴条件下的透光遮阴状况,确定适宜三叶犁头尖生长的人工栽培环境;通过对三叶犁头尖株高

学位

三叶犁头尖人工栽培开花物候生物学性状

马来西亚董教总版高中《华文》与人教版高中《语文》的对比研究

除中国内地及港澳台之外,马来西亚拥有最完整的华文教育体系及学习环境。从幼儿园、小学、中学到大专,马来西亚都有以华文为教育媒介的学校。19世纪初,华文教育就以私塾的形式在马来半岛和新加坡出现。在80年代,马来西亚华校董事联合会总会(简称为董教总)出版了第一套华文教材。但随着时代、社会的改变,中国与马来西亚都经历过了一场教育改革,而教育改革最主要的体现就在教科书上。由于受到生活环境的影响,马来西亚华人

学位

中国马来西亚高中汉语教科书比较研究

天然橡胶/芳纶短纤维复合材料力学性能的研究

相容剂是提高纤维与橡胶基体界面粘合的重要手段。本文使用热空气氧化对芳纶纤维表面进行处理,去除纤维表面的有机涂层及提高纤维表面的极性基团含量,通过溶液法设计合成了不

学位

芳纶纤维复合材料相容剂增容效果界面表征

钼的光谱发射率特性研究

钼因其活性高、线膨胀系数低、弹性模量好等优良特性而被广泛应用在化学工程、钢铁制造和电子工艺等领域。金属加工需要精确的热物理数据,在高温情况下的金属的温度通常使用

学位

光谱发射率积分极化热氧化

基于壳-核结构的相变储湿复合材料制备及热湿性能研究

随着经济和社会的发展,人们生活质量的提高,对居住建筑的室内环境舒适度的要求也随之提高,由此势必增加建筑能耗,而建筑能耗又占我国能源总能耗的三分之一,尤其是随着城镇化

学位

壳-核结构相变储湿复合材料热湿性能溶胶-凝胶法

介孔SiO_x/碳复合材料在锂离子储能体系中的应用

作为一种极具应用前景的储锂负极材料,硅具有理论比容量高(4200 mAh g-1)、工作电位较低(0.4 V vs.Li+/Li)以及地壳丰度高(27%)等优点。然而,硅电导率低(6.7×10-4 S cm-1),且在锂化/去锂化过程中体积变化大(>300%),导致其倍率和循环性能较差,严重制约了硅负极材料的应用。针对上述问题,本论文制备了两类介孔SiO_x/碳复合材料,并研究了它们作为锂离

学位

锂离子电池锂离子电容器硅/碳负极材料介孔结构

基于多核处理平台的HEVC解码核心模块并行处理的算法设计与实现

其他学术论文