H.264帧内/帧间模式选择快速算法

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:wyp345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264/AVC(Advanced Video Coding)是ITU-T和MPEG合作制定的视频编码标准,该标准同时作为MPEG-4的第10部分,是目前最新的视频编码标准,与以往标准相比,H.264在帧内编码,帧间预测,变换量化和熵编码等方面采用了多种新技术,大幅度提高了编码效率。与H.263 v2(H.263+)或MPEG-4 Simple Profile相比,H.264/AVC在使用与上述编码方法类似的最佳编码器时,在相同比特率下视频质量提高一倍以上。在H.264中,主要采用了基于率失真理论的率失真最优化算法来在不同的模式中进行取舍。选择最优模式的算法称为率失真优化RDO(rate distortion optimization)。虽然H.264采用RD-OPT算法可以明显改善SNR和比特率,但同时也导致了运算复杂度的急剧上升。从编码时间来看,采用RD-OPT使时间急剧增加。在帧内预测模式下,为了确定一个宏块的帧内预测模式,要执行592种RD Cost计算。而帧间预测模式下,由于涉及到多参考帧的选取,因此会带来更大的运算复杂度。本文首先介绍了H.264编码标准中所使用的关键技术,简要介绍了率失真优化算法的原理及在H.264模式选择算法中的应用,并基于JM平台进行了说明。着重研究和分析了帧内以及帧间模式选择算法,并针对模式选择部分进行算法级的优化,降低模式选择算法复杂度,提高编码的速度。本文的创新点在于两个方面:一是在帧内模式选择中利用图像宏块本身的空间相关性进行预运算,得出预测方向,减少预测模式数目;二是在帧间模式选择中利用边缘检测算子对宏块的边缘强度进行统计,利用统计的方法对各种模式之间进行划分,从而有效地减少了帧间模式选择算法运算复杂度。
其他文献
现代信息技术的迅猛发展和人们生活质量的提高,使得视频处理方面的研究与应用,尤其是实时图像处理受到了广泛关注。近年来,DSP技术的不断发展,将数字信号处理领域的理论研究
语音是人们日常交流的主要手段,也是信息的主要载体之一。语音信号存在着很大的冗余度,因此语音压缩在存储和数字化传输方面起到的至关重要的作用。随着通信、计算机网络技术
随着高速飞行器的发明,传统机械扫描雷达由于天线惯性越来越难对高速飞行器进行探测,而相控阵雷达在波束转换速度以及波束形成灵活性上的巨大优势,使其已经受到各国的广泛关
在早前,诸如雷达、通信以及电子战等应用通常在收发操作层面上是相互独立的,且分别拥有各自独立的收发器及信号处理设备。由此也带来了资源冗余、电磁兼容性差、规模庞大、缺
Windows CE是微软公司推出的一项功能强大的实时嵌入式操作系统,它具有很多优秀的性能。Windows CE操作系统的模块化设计,使得开发人员可以根据需求定制设备,这种定制有助于
语音转换是指改变一个人(源说话人)的语音个性特征使之具备另一个人(目标说话人)的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种语音处理技术。随着现代
极化合成孔径雷达(Polarimetric SAR)影像包含丰富的目标信息,近年来成为遥感识别领域的研究热点。其中,地物分类方法的研究是极化SAR影像解译的重要组成部分,在军事、民用等
传统米波雷达规模庞大、机动性不足、造价成本较高。为了提高米波雷达的测角精度同时保持一定的机动性,本课题组提出了分布式米波雷达的实现方案,利用多个分布式的小型米波阵