论文部分内容阅读
H.264视频压缩标准是近年来最流行也最成熟的视频压缩标准,国外的研究者对H.264硬件编解码器的IP核实现已经做到相当高的水平,鉴于此类IP核的使用不能通过相关参数满足各种场景的特定应用以及使用此类IP核时需要支付昂贵的费用,所以自己开发H.264视频编解码的硬件系统是非常有必要和有挑战性的。H.264视频压缩标准卓越的压缩性能是以高的复杂度以及庞大的计算量为代价实现的,为了使本文H.264帧内视频编解码系统硬件实现的开发周期相对变短、设计复杂度相对降低以及设计的工作量相对降低,本文基于Xilinx HLS开发工具提出H.264帧内视频压缩编码系统硬件实现的嵌入式架构,在较高的层次内实现了H.264帧内视频编解码系统的硬件开发。本文针对上述嵌入式架构中的码率控制模块采取MicroBlaze嵌入式软核实现,并且对码率控制模块的算法实现进行优化,使得第一帧编码图像的码率控制可以在600us内完成,其余帧编码图像的码率控制可以在13us内完成,这意味着码率控制的速度丝毫不会影响整个帧内编码系统的实现速度;本文针对上述嵌入式架构中的宏块参考信息加载与更新模块提出一行零一个宏块参考信息的存储逻辑,相比较原本算法存储一帧编码图像所有宏块参考信息的存储逻辑来说减少了26%的BRAM使用,避免了硬件资源的浪费;本文针对上述嵌入式架构中的帧内预测与重建模块提出Intra4×4、Intra16×16与Intra8×8三种预测方式及其每一种预测模式均并行实现的结构,其中对Intra4×4预测方式的9种预测模式的计算公式进行重构使得9种预测模式的计算可以在一个时钟周期内完成,并进一步采取4×4子块16个像素并行、非参考像素不进行重建以及仅选择有效预测模式进行比较等方法加快Intra4×4预测方式的实现,同时根据Intra16×16与Intra8×8预测方式Plane预测模式计算过程中4×4子块内与4×4子块间的递加规律提出16×16块划分为16个4×4子块进行循环处理,进一步采取仅实现参考像素的重建加快Intra16×16预测方式的实现并减少Intra16×16预测模式的资源消耗。本文上述嵌入式架构的HLS仿真结果与硬件实现结果一致,即实现编码的速度均是1.68cycles/pixel,足够处理1080P@25Hz视频序列的实时编码。本文通过上述嵌入式架构压缩编码前与硬件解码后图像质量的主观评价与客观评价进一步说明了该嵌入式架构实现H.264帧内编码系统的有效性和可行性。