论文部分内容阅读
视频压缩不仅是必要的,而且是可能的。视频序列帧内与帧间的冗余使得视频压缩成为可能。最新的视频编码标准H.264将每个视频图像分成16x16的像素宏块,使得视频图像能以像素宏块为单位进行处理。H.264采用了多种视频处理技术:利用时域相关性、利用残差的空域冗余度、采用变换、量化、扫描输出和熵编码、采用多种图像类型等。采用了这些先进的编码技术后,压缩性能和解码质量都获得了很大的提高。一些研究的实验数据表明,H.264在信噪比,压缩效率和视觉效果方面,都远远好于现有的其它视频编码标准。H.264采用基于块匹配的运动搜索算法。全搜索算法搜索遍及搜索窗每一个点,计算量太大,搜索速度严重影响了其应用。为了降低H.264编码器的复杂度,人们提出了很多快速搜索算法,有三步搜索法(TSS),二维对数法(TDL),交叉搜索法(CS),最临近搜索法(NNS),共扼方向搜索法(CDS),基于块的梯度下降搜索法(BBGDS)等。本文对常用的几种快速搜索算法进行了改进,增加了部分残差提前退出计算的方法,对已经搜索过的候选点进行标记,对于搜索模板中搜索点选择最优的搜索顺序,因此在保持信噪比损失较小的情况下,进一步提高了搜索速度。除此之外,本文还提出了两种复合型的搜索算法——单形体最小化搜索算法与EPZS改进算法。常用快速算法假设残差曲面是单峰的单调曲面,但是实际上会出现很多多峰的复杂残差曲面情况,因此易落入局部最优的陷阱。单形体最小化搜索算法利用数学中单形体的最优值搜索的思想,在搜索窗的多峰残差曲面上通过反射、扩张和收缩等手段,很好的避免了陷入局部最优,解决了常用快速算法的普遍问题。而且本算法还将EPZS算法中提供的预测矢量集引入进来,使得最初搜索点的初始化对于全局最优点的覆盖可能性大大增加,进一步地避免了落入全局最优的问题。EPZS是一种基于预测运动矢量场的自适应搜索算法,具有三个主要特征:初始预测矢量的选取,自适应中途停止策略,利用不同的搜索模板逐步的自适应改善预测性能。EPZS实现了很好的搜索性能,保持了与全搜索差不多的信噪比,搜索速度提高了200倍左右。但是正是由于EPZS提供了非常丰富的预测矢量集使得对于视频序列中很多空间域或时间域运动很小的块进行了很多无谓的搜索,因此浪费了一定搜索时间。而我们利用时间域预测矢量与空间域预测矢量的特点与关系判断出块运动的特点,特别对于具有较小运动的块进行了快速的跳转搜索,避开了无谓的预测矢量集,因此祛除了很多冗余的搜索时间。