可伸缩视频编码中的基础算法研究

来源 :中国科学院研究生院(软件研究所) | 被引量 : 5次 | 上传用户:xiaopirate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来互联网和多媒体技术的不断发展,面向互联网的视频流化(streaming)技术已经成为数字视频通信领域的一个新的热点研究方向。可伸缩视频编码,因其可以在不同的质量、帧率、分辨率甚至复杂度下解码,被视为网络环境下的一种很有前景的视频编码方案。然而目前可伸缩视频编码普遍编码效率较低,而且只适用于规则的矩形区域,限制了可伸缩视频编码的广泛应用。本文的研究工作即由此展开。在现有的高级精细可伸缩视频编码(FGS)基础上,本文创新性的提出了基于码率段的率失真优化编码器控制算法和三角区域的广义三角变换算法。前者可以有效的提高可伸缩视频编码的性能,而后者作为数字信号处理的基础算法之一,不仅为非规则区域的可伸缩视频编码提供了一种有效的变换方法,而且对非规则区域上的模式识别、图形图像处理以及几何造型等问题都有着重要的借鉴意义。具体来讲,本论文的主要研究成果如下: 首先,提出了一种面向高级FGS的两点率失真优化编码器控制算法。先对可伸缩视频编码中的率失真优化问题进行建模,提出了基于码率段的率失真优化模型,并针对高级FGS将模型进一步简化。通过实验指出了帧间相关性在可伸缩视频编码的率失真优化中不可忽略,并首次提出了通过定义EOD函数来近似帧间相关性的方法。作为一个实例,导出了PFGS中的EOD函数模型,并在此基础上得到了面向PFGS的两点率失真优化编码器控制算法。 其次,提出了基于PFGS的两点率失真优化的联合基本层和增强层模式选择算法。将两点率失真优化编码器控制算法应用到PFGS的模式选择中,提出了基于PFGS的两点率失真优化模式选择算法,并系统的讨论了算法中三种常用的权重策略。实验表明,算法可以大大提高整个码率段的编码效率,通过采用不同的权重策略,算法可以灵活的偏向于低码率段或高码率段的编码效率。 第三,构造出了三角区域的广义三角函数。DCT是视频编码的核心算法,但是对于三角区域目前没有相应的算法。本文通过求解重心坐标下的Sturm-Liouville特征方程,构造出了三角区域的广义正弦函数和广义余弦函数,并通过可视化与理论推导相结合的方法系统的研究了这两组函数的性质。 第四,提出了三角区域的离散广义三角变换以及相应的快速算法。在三角区域的广义正弦函数和广义余弦函数基础上,定义了三角区域的离散广义正弦变换和离散广义余弦变换。通过构造辅助函数和辅助变换,给出了相应的快速算法,并在此基础上实现了一个基于Matlab的非规则区域广义傅式变换函数库。实验表明,离散广义余弦变换对于光滑的三角采样数据具有良好的去相关作用。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着社会经济科技的不断发展,种种竞争无处不在,面对这样的社会环境,学生感受到前所未有的心理冲击。加之家长和学校的期望,学生们的心理压力倍增。如何培养学生健康的心理,做好学
目的评价术中B超引导下行肝癌切除术在预防肝癌术后复发的应用价值。方法35例肝癌患者在术中B超引导下行肝癌切除术(A组),另35例行常规肝癌切除术(B组),术后定期复查肝功能、AFP、C
正交频分多址(OFDMA)是将正交频分复用(OFDM)技术和频分多址(FDMA)技术相结合的多址方案,被认为是第四代移动通信系统(4G)的关键技术之一。OFDMA以OFDM调制为基础,通过给每个用
对北部湾一号项目标志性建筑物进行雷击风险评估分析,了解和掌握雷击风险评估方法及注意事项。
我们采用扫描电镜,观察了毫米波辐射对兔眼角膜内皮细胞超微结构的影响,探讨了毫米波辐射引起免眼角膜内皮细胞损伤的可能机理.1材料和方法1·l实验动物成年青紫兰兔48只,体重(2士
随着移动互联网与社会网络的深度融合,基于位置服务(Location Based Service,LBS)的社交媒体应用更加流行,成为地理社会网络(Geo-Social Networks,GSN)的研究重点。基于位置信息
不锈钢车体已成为目前地铁车辆轻量化发展的方向之一。在不锈钢车体结构中常用的奥氏体不锈钢及高耐候钢都具有易加工成形的特点,非常适合应用自由形状优化技术完成结构优化