视频快速感兴趣区域提取算法研究及应用

来源 :东南大学 | 被引量 : 2次 | 上传用户:askkwr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
感兴趣区域(Region of Interest)是指图像中能够引起人眼注意,包含关键性信息的部分。在图像处理之前,进行ROI提取可以极大的减少计算机的计算量,提高运算效率。图像ROI提取在图像压缩编码、目标识别、图像检索等领域有着重要的应用,有极大的研究价值。图像ROI提取的方法有很多,其中基于视觉注意模型的方法是研究的热点。与图像相比,视频增加了时间线索,比静态图片更为复杂,应用传统的视觉注意模型对其进行处理容易丢失运动信息。同时,视频的数据量相对较大,需要算法有较高的提取速度,否则就没有应用价值;但算法在高效的同时,需要有良好的精确度,否则也不适合应用。本文在国内外研究的基础上,提出了一种全新的快速准确的视频感兴趣区域提取算法,并将其应用到视频压缩编码中,主要工作如下:(1)介绍了ROI提取方法的研究现状,根据应用需求,选择基于视觉注意模型的方法作为研究重点。详细阐述了三种视觉注意模型的基础知识,对它们的运算速度和提取结果进行比较分析,选择速度最快的SR模型作为本文的研究基础。(2)对于实验需要的视频,设计眼动实验,通过筛选处理眼动数据,得到有效的注视数据,通过高斯模拟分布得到眼动ROI,将其作为视频图像的真实ROI,作为评判其他方法准确度的标准。(3)从空间和时间信息两个方面对SR模型进行改进。在空间方面,通过对显著性信息在频域的分布特点进行分析,在模型中加入高斯核与幅度谱卷积的结果;SR模型只针对图像的灰度特征进行处理,在此基础上,加入颜色特征,并通过超复数傅里叶变换将其作为整体处理,节省计算时间;利用视频的时间信息,分析图像的相似程度,只对存在较大差异的图像进行计算,节约重复处理的时间。在时间方面,采用三帧差法进行运动特征提取。最后,将两个结果进行融合分割,得到最终的ROI,并通过客观的指标评价算法的准确度和效率。(4)在H.264编码标准中应用本文算法,通过PSNR对压缩得到的视频质量进行分析比较,发现应用ROI进行压缩编码可以在码率相同的情况下提高视频质量。本文基于SR模型,提出了一种全新的视频感兴趣区域提取算法。实验结果表明,本文算法提取的ROI与介绍的三种视觉注意模型相比,更加接近眼动ROI。同时,本文算法处理分辨率1920×1080、时长10S、帧率30FPS的视频所需时间为15.4S,与SR模型12.5S的处理时间接近,满足快速应用的需求。
其他文献
<正>有一种回忆是震撼,有一种纪念是敬仰。长征,世界战争史上的一个奇迹,长征,我们取之不尽、用之不竭的力量源泉。今年,是红军长征胜利七十周年。七十年来,长征精神激励着千
政府职能转变作为全面深化改革的重要组成部分,正确处理好政府与市场的关系对社会经济发展有着不可替代的作用。政府职能与市场的关系也是一个动态和变化的过程,唯有适应当前区情发展,切合实际,并立足于以人为本、符合社会发展规律的关系才是最恰当的关系。本文通过研究,进一步补充了地方政府经济职能与净土健康产业协调发展的相关研究理论,从理论研究层面为少数民族地区产业发展过程中政府经济职能定位及作用发挥范围,为政府
<正>财务管理的过程就是企业价值得以持续提升的过程。以企业的总体资源为理财对象,提高资源配置能力和效率、优化资本结构、转换经济增长方式,是提升企业价值的必然选择企业
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的探讨优质护理对心内科患者护理效果。方法研究区组挑选114例心内科的患者数据资料展开整合后进行数据分析并归入此次研究数据中以供后续分析,遵照纯随机抽样准则将研究区
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
基于认知语法中的识解,对"口"作为个体量词的使用进行探析。结果表明,个体量词"口"主要与三类名词共现,即表达与身体相关、与食物相关和与话语相关概念的名词。与不同种类名词的