H.264并行编码算法的研究和优化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:dianzi511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2001年,ISO的运动图像专家组(MPEG)和ITU/VCEG成立了联合视频组(JVT)共同发展和研究H.26L标准,并将研究草案纳入ITU-T视频技术建议H.264和ISO/MPEG组织制定的MPEG-4标准的Part 10(即AVC)中。H.264/AVC作为新一代视频编码算法吸收了以往编码方案的优点,在视频压缩性能和网络接口友好性上得到了很大的提高,但是这些优点都是以引入复杂度为前提的。分析H.264编码器的结构可知,其高复杂度的计算量主要来源于两个方面,一是帧间编码的1/4像素精度运动搜索,多种可变大小的块模式及多参考帧的运动估计;二是帧内编码的多种预测模式。如何快速的实现编、解码成了H.264目前急需解决的问题。目前几乎所有的CPU架构都在向多核化方向发展,例如Intel、AMD的X86、IBM的PowerPC等。跟传统的单核CPU相比,多核CPU带来了更强的并行处理能力和更高的计算密度。可以预见,多核CPU必将成为未来处理器市场上的主流产品。针对H.264编码的复杂性,人们提出了很多并行优化的方法。一种是基于指令级的并行(ILP),例如很多DSP平台提供的单指令多数据流(SIMD)指令;另一种是基于线程级的并行(TLP),这种方法需要和多核技术相互配合来实现。试验证明,单纯使用任何一种方法都不能实现编码的最大并行化。考虑到X264本身已经实现了X86平台下的指令级并行,因此本文使用X264编码器作为研究对象,并在其SIMD指令级并行优化的基础上进行线程级并行优化,配合Intel的双核处理器平台,在Linux Fedora Core 5操作系统下获得了较高的编码加速比提升。X264当前采用基于Fork-Join模型的Slice级并行算法。测试结果表明:该模型开销较大,在低分辨率的编码应用中严重限制了Slice级并行算法所获得的编码加速比。为了避免Fork-Join模型带来的开销,本文在传统线程池的基础上提出了自适应线程池模型,并使用该模型对X264进行优化。对码流质量要求严格的非实时编码的应用场景,本文选取GOP级并行对X264编码器进行并行优化并获得接近线性的加速比。对码流质量要求严格的实时编码的应用场景,本文使用Frame级并行和Slice级并行相结合的方法,该算法避免了单纯使用Frame级并行获得的加速比低以及Slice并行会降低目标码流质量的缺点,在几乎不影响目标码流质量的前提下,获得了较高的加速比。
其他文献
当前无线通信的发展正处于最为关键的时期,人们持续增长的需求与有限频谱资源之间的矛盾成为研究高频谱利用率技术的动力和挑战。众多新技术中,基于多天线的MIMO系统已显示出无
2005年12月,IEEE批准了802.16的修订版本802.16e,这个版本增加了支持移动性的特性。移动WiMAX是通过宽带无线接入技术和灵活的网络架构实现的融合移动和固定宽带网络的宽带无
智能化项目信息管理系统是科研活动中重要的一部分,不仅能够提高工作效率,而且对于提高科研项目整体水平具有重要意义。项目管理系统中存在着数据传输效率低,数据容易被窃取以及
随着互联网技术的普及以及多媒体技术的快速发展,以数字图像为主的多媒体信息在人们的日常生活和工作中发挥着越来越重要的作用。然而随着图像数据库规模的逐步增大,如何对图像
安全生产、保障矿工的生命安全是煤炭行业永恒的主题,研制新型的煤矿井下人员定位系统是保证井下工作人员安全、实现快速救援的重要手段。矿难事故频发而营救效率十分低下的症
电视制导是当今应用较为广泛的一种精确制导方式,其关键技术就是视频信号的传输。传统的模拟信号因其所需带宽较宽、易受干扰等缺点而逐渐被数字信号所取代。为了获取高质量
2006年8月30日,国家标准委员会正式颁布了《数字电视地面广播传输系统帧结构、信道编码和调制》国家标准。该国家地面数字电视传输标准主要融合了清华大学的多载波方案DMB-T
藻类是一种原生生物界的植物样生物,一般生活在水中,地球上的光合作用90%由藻类进行,将其按门类可分为11个门。绿藻门是藻类中极为重要的一个门,绿藻类的研究与绿色食品、绿色能
近些年来,作为数据网络的因特网得到的飞速的发展,它在人们的生活中占有越来越重要的地位。为了满足飞速发展的因特网的需求,人们开始开发在覆盖范围上具有优势的卫星网络的
高分辨率感应测井仪中,地面系统是一个很重要的组成部分,主要完成测井地面仪设备与井下仪器之间大量数据的高速实时传输以及信息处理和接口技术。本文的研究目的是设计出与高分