论文部分内容阅读
随着通信、计算机、广播电视和微电子技术的发展,数字视频处理与通信逐渐成为学术界和产业界所共同关注的一个研究领域。特别是数字视频通信传输编码国际标准H.261,263和多媒体压缩编码国际标准MPEG-1,2,4,7的制定,以及高速处理芯片和大容量存储器的出现,使得数字视频产品日益普及,对人们的日常生活、生产、商业、科研、教育、军事等领域产生了十分重要的影响,在高清晰度电视、可视电话、视频会议、机器视觉、场景监控、寻的制导等应用中数字视频处理和通信技术发挥着极其关键的作用。本论文以数字视频的运动分析、对象分割与压缩传输应用技术为研究方向,对其中的重要研究点的理论体系、数理模型、技术原理、实现方案、算法步骤和实际应用做了深入而细致的研究和论述,取得了许多创造性的研究成果。数字视频的高效表征、压缩传输的一个重要基础是视频分割与对象提取,而运动分析又是视频分割的重要基础之一,所以本论文首先对运动分析模型作了概括性的归纳总结:论述了三维物体运动模型、摄像机成像模型和各种典型的运动场分析技术。在此基础上研究了运动场光流分析中光流计算的高阶项影响,提出了带有运动位移预补偿的组合光流分析技术,消除了直接运用光流方程求解帧间高速运动时出现的异常,提高了光流计算的精度。同时还讨论了光流计算中用帧间时差分代替时域微分所产生的误差,提出了逼近式光流分析技术,克服了相应误差对光流计算所产生的影响,得到了更加准确的运动场分析结果。并通过大量的实验证明了上述两种技术。在运动分析的基础上,本论文接着从两个方面研究了视频分割和对象提取:一方面研究了背景估计与合成,并通过背景对其它视频对象进行分割与提取;另一方面通过灰度形态学进行视频分割。在基于背景的视频分割方法中,首先需要分解出视频序列中的背景信息,所以本论文分析了数字视频的背景与前景分解描述模型,分别讨论了在摄像机静止和运动条件下的背景估计与合成算法。在此基础上进行了平面与非平面背景在运动摄像机观察视频序列中的可补偿性分析,从理论和实例两个方面证明了全景背景合成中的平面背景前提条件,并提出了基于层次背景表征的压缩编码方案。这不仅有利于后续的运动目标检测与对象分割,而且也有利于数字视频的分层高效表征、压缩与传输。在背景信息获取之后,本论文结合实际工程应用对基于背景差的视频分割与对象提取进行了论述,着重讨论了视频序列中定轨道区域运动目标流分析技术,通过帧间时空位置与灰度特征组合相似性算子实现了分割后的运动目标跟<WP=9>踪,在此基础上结合背景区域的轨道划分信息,对大视场观察条件下的运动目标流按轨道进行了分解,对小视场观察条件下的定轨道运动目标进行了特定空间位置采样。最后结合工程应用,对交通路口实际拍摄的车流交通视频序列进行了分析处理,取得了较好的实验结果。在采用灰度形态学进行视频分割的方法中,通过时空势能函数的引入,把Watershed算法由二维平面空间扩展到了三维时空空间,并针对全局三维Watershed算法实现视频序列分割时对存储和处理空间需求巨大这一缺陷,提出了滑动窗口式三维Watershed算法,通过水源区标号传递和局部流域更新相结合的方法,实现了局域处理和全局处理的一致性,并且所需要的存储和处理空间得到了很大的降低。在视频序列分割与对象提取的基础上,本论文对视频序列的高效表征进行了全面的论述。由于数字视频是一个三维时空序列,所以可以从时域和空域两个方面进行分析。时域高效表征主要是指时域亚采样,针对普通的时域等时间间隔亚采样操作的缺陷所在,本论文重点分析了数字视频时域非均匀亚采样技术,提出了两种不同的时域非均匀亚采样方法。一种是在给定采样帧率的条件下,以运动分析为基础,利用运动场总体能量和运动补偿后的残差能量来综合度量运动变化信息,建立了基于运动变化信息熵最大化的视频序列时域亚采样技术。另一种方法是以视频分层表征为基础,对背景层数据单独压缩,而对运动目标层实施保持应用特征信息的时域亚采样操作后再进行压缩。以这样的方式来组织视频数据流,不仅可以达到时域高效率表征的目的,而且更有利于对视频内容的理解。本论文还通过大量的实验验证了上述两种技术的有效性和实用性,以及相对于通常的时域等时间间隔亚采样操作的优越性。在视频序列的空域高效表征中,本论文从全新的角度出发,充分利用图像块之间的冗余信息,重点讨论了任意子空域丢失图像信息的恢复与重建问题,提出了两种图像重建方法:一种是矩形区域丢失图像信息的自适应重建技术,利用矩形区域残留的边界信号以及边界信号的DCT系数能量分布特征,自适应地确定区域内部的DCT系数值,然后通过IDCT得到重建后的图像。另一种是基于人眼视觉特性的任意形状区域丢失图像信息的重建技术,在考虑人眼视觉特性的前提下通过加权最小二乘方法实施DCT系数的恢复与重建,然后通过IDCT得到重建后的图像。最后通过大量的实验证明了上述两种技术相对于通常的图像重建方法来说,重建后的图像具有更高的主观质量和客观质量。上述技术具有广阔的应用领域,特别是对于数字图像和数字视频的空域高效表征和受损复原等方面具有十分重要的意义,所以在