面向360度全景视频的通用编码标准VVC的快速编码方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haicang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今虚拟现实技术日益成熟,360度全景视频作为一种提供浸入式体验的新颖内容载体已经引起越来越多的关注,其逐渐成为计算机科学,军事和工商业等应用领域的研究热点。与传统视频相比,360度全景视频场景覆盖范围更广,数据量更大,但同时带来的问题是传输更加费时,所占用的存储空间以及传输带宽也更多,对设备的硬件要求也更高,因此编码效率问题亟待解决。本论文针对通用视频编码标准H.266/VVC(Versatile Video Coding,VVC)下360度全景视频编码复杂度过高造成编码时间长的问题,探究在保证一定编码性能的情况下减少编码时间的方法。主要研究内容具体如下:首先,针对在360度全景视频编码过程中,因块划分方式决策过程编码复杂度较高而导致编码时间过长的问题,本文提出了一种块划分方式快速决策算法。本算法首先利用等距矩形(Equirectangular Projection,ERP)映射格式下两极和赤道处采样不均匀的特性对整幅图形进行区域划分,初步缩小当前编码单元(Coding Unit,CU)所在的编码树单元(Coding Tree Unit,CTU)的编码深度区间。接着利用引入的交流系数能量对CTU进行图像纹理复杂度的判定,进一步限制当前CTU的编码深度区间。然后利用CTU的空间相关性进一步减小当前CTU的编码深度区间。最后借助当前CTU的编码深度区间实现当前CU的编码深度预测以及划分方式的提前终止,这一改进极大地减少了相应块划分方式下的率失真代价值(Rate Distortion Cost,RDC)的计算量。实验结果表明,提出的算法比原始算法平均节省了44.06%的编码时间,与此同时,引起较少的码率增加和较低的峰值信噪比下降。其次,针对在360度全景视频编码时,因编码模式决策过程造成的编码耗时大的问题,本文提出了一种编码模式快速决策算法。本算法首先利用相邻编码深度间编码模式的相关性,对编码模式数量进行初步筛减。接着利用哈达玛变化代价值的倍数关系,对编码模式数量进行进一步筛减。该算法通过减少编码模式数量进而减少了相应编码模式下代价值的计算量,实现了快速编码。与VVC标准的原始算法相比,提出的算法平均编码时间缩短了27.63%,同时码率增加和峰值信噪比下降均不明显。此外,由于块划分方式决策过程和编码模式决策过程都属于帧内预测过程,本文还将两种算法进行结合生成了帧内预测快速算法。在客观评价指标下,提出的算法相较于原始算法平均编码时间减少了55.77%,编码性能存在一定程度的下降。在主观评价指标下,相较于原始算法,提出的算法产生的图像失真可忽略不计。最后,针对在360度全景视频编码时,帧间预测过程计算量大的问题,本文提出了一种帧间预测快速算法。本算法首先利用已完成编码的时域相邻帧进行运动复杂度阈值的确定,然后利用已完成编码的空间相邻CU的运动复杂度对当前CU的运动剧烈程度进行预测,进而针对不同运动剧烈程度制定不同的运动搜索范围缩减策略,减少了当前CU寻找最佳运动矢量时进行率失真代价值计算的计算量。实验结果证明,与原始算法相比,提出的算法在性能几乎没有下降的情况下实现了平均0.88%的编码时间节省。
其他文献
随着探索太空以及航天活动不断增加,各国对空间非合作目标,尤其是处于地球低轨上的非合作目标的位姿估计的重视程度不断提高。各国发射卫星数量逐年攀升,对高价值航天器的在轨维护、故障或失控航天器的捕获、太空碎片清理等与非合作目标位姿估计相关的需求越来越大。基于激光雷达空间非合作目标位姿估计一般需要已知非合作目标的点云模型等。首先,对激光雷达数据接收接口进行设计,并在SDK上加入对于点云库的依赖,使激光点云
基于激光雷达扫描点云的三维物体目标检测算法是自动驾驶场景感知算法的重要组成部分,它对于自动驾驶的安全性有十分重要的意义,该检测算法的有效性将直接决定自动驾驶是否能够落地。在二维图像检测较为成熟以后,深度学习从2017年进军三维物体检测,并且已经有不少三维物体检测方法崭露头角。目前较为有名的算法都可以分为两大类,Point类和Voxel类。Voxel类用体素来作为点云的表征方式,发展历程最久,但其原
在现代电子战中,利用无人机集群进行无源定位来获得目标辐射源的方位信息的方法受到了广泛关注。当集群侦察的未知目标辐射源数目较多时,每架无人机的接收信号是多个辐射源原始信号经传输信道后的混合信号。为获得更为精准的定位信息,如何从多架无人机接收到的混合信号得到各辐射源的原始信号是一个关键问题。为解决该问题,本文基于正则平行分解和时频分析方法,分别研究了瞬时混合模型和卷积混合模型的信号分离方法。首先,针对
探地雷达(Ground Penetrating Radar,简称GPR)是一种流行的非破坏性地球勘探技术,利用天线发射的雷达波在地下不同介质间发生的反射、散射等得到目标信息,具有广泛的应用,如公路桥梁土木工程质检、地下水文素质检测、城市地下管线检测、冰川地质检测、考古等。GPR面对的工作环境是介电常数不恒定的地下土壤介质,其发射的雷达波在传播过程中不能保持直线传播,会发生无规律的散射、折射等现象,
新生儿黄疸是新生儿较常出现的一类病症,被称作高胆红素症,这类病症之所以会出现,与新生儿胆红素出现异常的代谢现象有关。如果新生儿出现了异常的代谢现象就很容易使得血液中胆红素陡然升高,在这种情况下,新生儿的皮肤会出现黄疸现象。就目前来看,新生儿出现黄疸的发病率呈逐年上升的趋势,相比较足月生产的胎儿而言,早产儿更容易出现黄疸现象。新生儿出现黄疸现象后,如果未能及时进行相关病症的治疗,很可能会触发较
期刊
血浆D-二聚体是纤维蛋白被纤溶酶降解时产生的特殊交联纤维蛋白衍生物,D-二聚体在妊娠期随孕周增加而增加,传统用于筛查正常人群静脉血栓形成的血浆D-二聚体参考值(≤0.5 mg/L)不适用于妊娠人群。因D-二聚体检测方法及计量单位不统一,目前尚无统一妊娠及产褥期D-二聚体正常参考值,各个地域或实验室,应通过大样本不同孕期血液样本凝血功能检测,建立自己的妊娠期不同孕周的D-二聚体参考值。现有越来越多研
随着无线通信技术、网络技术和人工智能技术等的高速发展,垂直行业新型应用发展迅速,这些新型应用呈现出来一个显著的特征就是对于通信的需求侧重点不同,于是人们对一个灵活的、可编程的、易扩展的通信架构有了更高的需求。网络切片技术用虚拟化的硬件系统代替专用的硬件设备,用软件定义网络使得网络的可编程性和可扩展性变强,能够更好的应对不同应用的多样化需求。通过对网络切片实施资源分配,可以提高网络资源利用率,提高用
高频地波雷达凭借着其超视距探测以及全天候工作的优良特性,在超视距预警和反低空突防领域发挥了重要作用。然而,由于高频地波雷达工作频段较低,其距离和角度分辨率较低,使单基站高频地波雷达定位精度较差。分布式高频地波雷达利用其多站同时观测的特点,具备提升高频地波雷达对目标的发现能力和定位精度的能力。本课题基于分布式高频地波雷达体制,开展基于多站多测量信息的目标定位技术研究,以提高高频地波雷达的定位精度。本
道路是城市的关键基建设施,保障其安全性是城市建设的重要一环,而地下空洞是威胁道路安全的隐患之一。作为一种地下空间勘探方式,探地雷达在道路的日常维护中起到了重要作用,它通过发射电磁波并接收反射回波的信号,再经后期处理对信号进行成像。目前应用较为广泛的地下空洞识别方法主要基于对探地雷达图像的人工判读,但人工判读对操作人员要求高且效率低下,因此引入机器学习和深度学习等方法是探地雷达地下空洞目标识别的一个
由于抗干扰、隐身,易组网等特点,外辐射雷达迅速发展。外辐射雷达进行目标检测具有一定的缺陷,包含单站接收到辐射源信号功率较低,目标通常被直达波、多径杂波淹没,因此联合多个接收站进行目标检测成为重要的发展方向。多接收站能够从不同角度观测目标,减少了由目标闪烁对目标检测的影响,同时多个接收站联合目标检测能够增加目标的信噪比,在一定程度上弥补外辐射源雷达回波功率低的缺点,因此外辐射源多站目标检测具有一定研