数字视频运动分析、对象分割与压缩传输应用技术研究

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:melancholy111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信、计算机、广播电视和微电子技术的发展,数字视频处理与通信逐渐成为学术界和产业界所共同关注的一个研究领域。特别是数字视频通信传输编码国际标准H.261,263和多媒体压缩编码国际标准MPEG-1,2,4,7的制定,以及高速处理芯片和大容量存储器的出现,使得数字视频产品日益普及,对人们的日常生活、生产、商业、科研、教育、军事等领域产生了十分重要的影响,在高清晰度电视、可视电话、视频会议、机器视觉、场景监控、寻的制导等应用中数字视频处理和通信技术发挥着极其关键的作用。本论文以数字视频的运动分析、对象分割与压缩传输应用技术为研究方向,对其中的重要研究点的理论体系、数理模型、技术原理、实现方案、算法步骤和实际应用做了深入而细致的研究和论述,取得了许多创造性的研究成果。数字视频的高效表征、压缩传输的一个重要基础是视频分割与对象提取,而运动分析又是视频分割的重要基础之一,所以本论文首先对运动分析模型作了概括性的归纳总结:论述了三维物体运动模型、摄像机成像模型和各种典型的运动场分析技术。在此基础上研究了运动场光流分析中光流计算的高阶项影响,提出了带有运动位移预补偿的组合光流分析技术,消除了直接运用光流方程求解帧间高速运动时出现的异常,提高了光流计算的精度。同时还讨论了光流计算中用帧间时差分代替时域微分所产生的误差,提出了逼近式光流分析技术,克服了相应误差对光流计算所产生的影响,得到了更加准确的运动场分析结果。并通过大量的实验证明了上述两种技术。在运动分析的基础上,本论文接着从两个方面研究了视频分割和对象提取:一方面研究了背景估计与合成,并通过背景对其它视频对象进行分割与提取;另一方面通过灰度形态学进行视频分割。在基于背景的视频分割方法中,首先需要分解出视频序列中的背景信息,所以本论文分析了数字视频的背景与前景分解描述模型,分别讨论了在摄像机静止和运动条件下的背景估计与合成算法。在此基础上进行了平面与非平面背景在运动摄像机观察视频序列中的可补偿性分析,从理论和实例两个方面证明了全景背景合成中的平面背景前提条件,并提出了基于层次背景表征的压缩编码方案。这不仅有利于后续的运动目标检测与对象分割,而且也有利于数字视频的分层高效表征、压缩与传输。在背景信息获取之后,本论文结合实际工程应用对基于背景差的视频分割与对象提取进行了论述,着重讨论了视频序列中定轨道区域运动目标流分析技术,通过帧间时空位置与灰度特征组合相似性算子实现了分割后的运动目标跟<WP=9>踪,在此基础上结合背景区域的轨道划分信息,对大视场观察条件下的运动目标流按轨道进行了分解,对小视场观察条件下的定轨道运动目标进行了特定空间位置采样。最后结合工程应用,对交通路口实际拍摄的车流交通视频序列进行了分析处理,取得了较好的实验结果。在采用灰度形态学进行视频分割的方法中,通过时空势能函数的引入,把Watershed算法由二维平面空间扩展到了三维时空空间,并针对全局三维Watershed算法实现视频序列分割时对存储和处理空间需求巨大这一缺陷,提出了滑动窗口式三维Watershed算法,通过水源区标号传递和局部流域更新相结合的方法,实现了局域处理和全局处理的一致性,并且所需要的存储和处理空间得到了很大的降低。在视频序列分割与对象提取的基础上,本论文对视频序列的高效表征进行了全面的论述。由于数字视频是一个三维时空序列,所以可以从时域和空域两个方面进行分析。时域高效表征主要是指时域亚采样,针对普通的时域等时间间隔亚采样操作的缺陷所在,本论文重点分析了数字视频时域非均匀亚采样技术,提出了两种不同的时域非均匀亚采样方法。一种是在给定采样帧率的条件下,以运动分析为基础,利用运动场总体能量和运动补偿后的残差能量来综合度量运动变化信息,建立了基于运动变化信息熵最大化的视频序列时域亚采样技术。另一种方法是以视频分层表征为基础,对背景层数据单独压缩,而对运动目标层实施保持应用特征信息的时域亚采样操作后再进行压缩。以这样的方式来组织视频数据流,不仅可以达到时域高效率表征的目的,而且更有利于对视频内容的理解。本论文还通过大量的实验验证了上述两种技术的有效性和实用性,以及相对于通常的时域等时间间隔亚采样操作的优越性。在视频序列的空域高效表征中,本论文从全新的角度出发,充分利用图像块之间的冗余信息,重点讨论了任意子空域丢失图像信息的恢复与重建问题,提出了两种图像重建方法:一种是矩形区域丢失图像信息的自适应重建技术,利用矩形区域残留的边界信号以及边界信号的DCT系数能量分布特征,自适应地确定区域内部的DCT系数值,然后通过IDCT得到重建后的图像。另一种是基于人眼视觉特性的任意形状区域丢失图像信息的重建技术,在考虑人眼视觉特性的前提下通过加权最小二乘方法实施DCT系数的恢复与重建,然后通过IDCT得到重建后的图像。最后通过大量的实验证明了上述两种技术相对于通常的图像重建方法来说,重建后的图像具有更高的主观质量和客观质量。上述技术具有广阔的应用领域,特别是对于数字图像和数字视频的空域高效表征和受损复原等方面具有十分重要的意义,所以在
其他文献
大学生患病原因 (1)个体的人格特征差异 人格影响着个体的情绪过程、动机过程和认知过程,不同人格特征的人,患抑郁症的机率不同.内向型的人由于其性格内向,一般不会主动与人
期刊
笔者有幸在马来西亚彭亨大学进行了一学年的汉语教学,教学过程中,笔者发现彭亨大学的非华裔学生在汉字学习中存在着诸多问题。文章以教学实践为基础,以马来西亚彭亨大学为调查对象,分析彭亨大学非华裔学生在汉字学习以及教师教授过程中存在的问题并提出相应的解决方案。调查结果显示,马来西亚彭亨大学汉字教学存在以下问题:一、华语班课堂与汉字班课堂授课内容相比,华语班讲授的汉字知识较少,学生认识汉字的能力有限。由于汉
在电子商务发展迅速的今天,网络的运行状态,是电子商务能否顺利进行的有力保障,现有网络资源的利用率高低就一个重要问题,网络的负载平衡就是解决这个问题的方法之一,下面对
随着现代物流管理的地位日益提高,制造业纷纷开展物流改革,推行现代物流管理。但这其中成功的企业却并不多见。本文基于这种现状,针对不同的企业提出了不同的改革思路,分别从
增加社会流动性是消除贫困的重要方式,在儿童阶段即对贫困人群进行干预尤其必要。政府可通过家庭养育和早期教育的政策干预来提升社会流动性,从而达到扶贫目的。本研究分析了
通过研究发现,世界上产出的金刚石原生矿在大地构造环境、岩石特征、特征矿物等方面虽有所差异,但在控矿地质条件、地球物理化学特征、金刚石特征和找矿方法等方面具有较强的
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
目的研究在体外染毒条件下硒对镉转化人支气管上皮细胞系16HBE凋亡和癌基因表达的影响。方法用0.625、1.25、2.5和5.0μmol/L亚硒酸钠染毒镉转化16HBE细胞24h,用流式细胞术检
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
肉类在油炸过程中发生的化学变化白卫东,赵文红肉制食品肉类采用油炸的方法制成食品,既是对易腐食品的一种短期贮藏手段,也是食品加工的一种方法。油炸制品是利用油脂的导热性,在