在线视频摘要关键技术研究及实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:binhaiwz_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步以及信息社会的快速发展,我国安保工作力度日益增强,人们也越来越注重公共领域的安全防范和监管,因此产生了大量的监控视频数据。这些海量的监控视频不仅给人力的有效检索与快速浏览带来巨大挑战,同时也为视频数据的有效存储带来沉重压力,因此未能得到充分的利用。因此能够以更加紧凑、简短的摘要视频对原始冗余视频进行浓缩表示的视频摘要技术得到了广泛的关注与研究,然而实际应用中对监控视频的实时浓缩处理存在着迫切需求,此外过度压缩也会导致运动对象间的遮挡和运动结构改变等情况,同时图像的合成技术也会一定程度上影响最终视频的表现质量。因此对监控场景下,在线视频摘要框架及其关键技术的研究与改进则显得尤为重要。针对上述处理难点,本文着重对视频摘要中的管道重排列算法及其与背景的图像合成技术进行了研究与改进,主要工作内容包含以下几个方面:1、研究设计了在线视频摘要技术的总体框架。考虑到离线机制下的视频摘要技术在处理长视频时的多种限制,由动态背景的生成、运动对象的检测与跟踪、运动对象的时空重排列及其与背景的图像合成这几个关键模块组成在线视频摘要的总体技术框架,能够在读取原始冗余视频的同时生成浓缩的摘要视频。2、改进了运动对象的重排列算法,压缩视频的时间冗余。综合考虑运动对象移动过程中彼此间的遮挡比例及其时序变化情况,同时注意保持彼此间的运动结构,引入的两级压缩空间及其更新机制实现了整个框架的在线处理能力。利用改进后的管道重排列算法能够优化摘要视频的表示质量,并且极大的提高了运算处理效率。3、改进了运动对象与视频背景之间的图像合成算法。考虑到视频摘要框架下需要进行大量多次的图像合成操作这个特点,采用均值坐标插值方法实现图像合成过程中的插值运算,在此基础之上考虑到合成区域的对称性质对其进行了改进,最终只需计算四分之一区域的均值坐标即可实现整个区域的图像合成操作,相比于经典的泊松图像编辑技术,能够极大缩短图像合成过程中的运算时间,同时具有类似的、自然和谐的图像合成效果。4、实现了基于特征的视频内容筛选与检索技术,在视频摘要技术的基础上进一步缩减了视频上的内容冗余。通过对视频中物体的运动、形状和区域特征进行描述、量化与分类,并指定感兴趣对象所具有的相关特征,通过去除视频中的内容冗余而在原有摘要结果的基础上进一步提高视频浏览与检索的效率。
其他文献
在雷达天线、火炮控制军事与数控机床工业控制领域中,角度信息是一个重要的参数。传统的台式角度测量系统体积大,操作复杂,通用性差。本文分析自整角机、旋转变压器轴角传感
雷达组网是一种高性能、多功能的新型雷达系统,具有高效的资源配置、可变的参数控制、强大的数据处理能力以及空间多样性特点,可以使目标探测和跟踪性能得到一定的改进,因此
人脸检测作为人脸识别技术的基础,已经成为计算机视觉和模式识别领域中的研究和智能应用的热点。由于Viola和Jones的开创性工作使得正面人脸检测技术已经达到实际应用的水平,
伴随着计算机技术的发展,电脑能更加快速的计算处理数据,与此同时,人与计算机的交互技术也在不断的变革当中。长久以来,我们与计算机的交互都依赖于键盘和鼠标,随着时间的推移,渐渐
随着现代各种通信技术的发展,非合作通信也逐渐显示出了它在通信领域的重要地位,尤其是软件无线电概念的提出,信号的检测、调制方式识别、参数估计逐渐被业界所关注。本文基
在计算机视觉系统中,物体深度信息的测量一直是热点问题,它是三维重构技术的关键。近年来,基于散焦图像的物体深度估计算法受到越来越多的关注和研究,它属于单目视觉,避免了
射频识别(Radio Frequency Identification, RFID)技术是一种非接触式的自动识别技术,特别是UHF频段因其识别速度及识别距离等各种优势成为各国研究的热点。标签应用环境具有
正交频分复用(OFDM)技术可提供高速数据传输速率,能够抵抗频率选择性衰落,具有较高的频谱利用率,因此已被诸多无线和移动通信标准所采纳。然而,OFDM信号的高峰值平均功率比(PAPR)