基于CNN的HEVC帧内PU编码优化及CNN的硬件实现

来源 :清华大学 | 被引量 : 0次 | 上传用户:dg9902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HEVC是新一代视频编码协议,在2013年4月份被正式提出。相比于上一代协议H.264/AVC,HEVC在保证视频质量的前提下,减少了近50%码率。为了改善图像信息的预测精度,HEVC引入了许多创新技术。对于帧内编码而言,HEVC引入了CU、PU和TU等新的划分单元,使得图片的划分更加灵活精确。在帧内PU的预测过程中,HEVC更是采用了多达35种预测模式对PU进行预测,从而提高预测的精准性。当然,无论是精确的预测过程,还是高的压缩率,其代价都是计算复杂度的提高。HEVC的计算复杂度是H.264/AVC的近4倍,这也是限制其被广泛应用的重要原因之一。本文中,我们引入卷积神经网络代替HEVC帧内PU模式决策中的RMD过程,引入角点检测算法来减少进入RDO过程中的PU预测模式个数。在相应的CNN的硬件实现中,我们采用11位浮点数来表示运算数据,用分段直线来拟合激活函数。该算法的优势主要体现在以下三点:(1)PU的模式决策跳过了RMD过程,采用CNN来获取PU的预测模式列表,从而减少计算复杂度;(2)CNN的输入仅为源图片像素和量化参数QP,这将使得算法具有高的并行性;(3)在CNN的硬件实现中,通过减少浮点运算的字长,从而节约了硬件资源。实验数据表明,与原算法相比,我们的优化算法平均节约了27.92%的帧内编码时间,仅仅引入了1.15%的编码码率上升。不仅如此,我们的算法也有一个稳定的性能,在编码最敏感序列(Class F)时,我们的算法节约了27.10%的帧内编码时间,仅仅引入了2.01%的码率上升。对于相应CNN的VLSI实现,在TSMC65纳米CMOS工艺库下,DC综合得到使用的逻辑门数量为56.1K,最大功耗为54.3mW。CNN处理一个PU的预测过程仅需要696个时钟周期。从最终结果可以看到,该帧内PU的优化算法可以大幅度减少帧内编码的计算量,为实现低功耗、低延时的视频编码器提供基础。
其他文献
近几年,随着特朗普当任美国总统、英国脱欧、中美贸易摩擦等一系列事件的发生,逆全球化浪潮此起彼伏,全球经济政治环境愈发复杂和充满不确定性,这使得中国企业在对外贸易和扩
核磁共振(NMR)是化学与生物领域最有力的分析手段之一。然而,传统的高场核磁共振需要体积庞大、成本高昂的超导磁体,这还导致谱线的不均匀展宽、内部自旋相互作用被截断等问
随着软件行业在全球化范围内的高速发展,软件企业所面临的机遇与挑战日益显现。如何在错综复杂的市场环境下,软件项目管理部门或管理人员可以将有限的企业资源充分运用到多个
Higgs粒子是标准模型基本粒子中被最后观测到的粒子。通过自发对称破缺,费米子以及其它规范玻色子获得质量。2012年,欧洲核子中心宣布:大型强子对撞机上(LHC)发现一个新粒子,
学位
进入新世纪以来,投资已成为我国经济增长最主要的推动力,投资贡献不仅取决于量的增长,更要注重效率的提升。当前我国企业投资效率普遍低下,如何提高企业的投资效率是学术界与
1992年罗伯特·卡普兰与戴维·诺顿在《哈佛商业评论》上发表的《平衡计分卡——以考核驱动业绩》一文,标志着平衡计分卡的正式提出。平衡计分卡被誉为75年来最伟大的管理工
关于蛋白质的结构和功能,一般认为“序列决定结构,结构决定功能”。但是近年来,越来越多的研究人员发现有些蛋白质没有明确的三维结构,但是却具有特定的生物学功能。我们将这
水凝胶是一种高含水量,柔韧性,良好的机械强度和回弹性的三维网络结构聚合物。近年来,多功能(如自修复、自粘附、形状记忆和响应等)水凝胶已在很多领域被广泛的应用。尤其是
工业文明的繁荣带给我们很多便利,同时也造成了许多严峻的问题,其中温室效应在地球上造成的影响越来越严重。作为温室气体成分中的一种,CO2在大气中的含量近五年来不断攀升。
本文以渝东南地区下志留统龙马溪组页岩为研究对象,通过对渝东南地区4 口取心井岩心及五条野外剖面的观察和分析,根据岩性、沉积构造、古生物等特征,将渝东南地区龙马溪组页