论文部分内容阅读
感兴趣区域(Region of Interest)是指图像中能够引起人眼注意,包含关键性信息的部分。在图像处理之前,进行ROI提取可以极大的减少计算机的计算量,提高运算效率。图像ROI提取在图像压缩编码、目标识别、图像检索等领域有着重要的应用,有极大的研究价值。图像ROI提取的方法有很多,其中基于视觉注意模型的方法是研究的热点。与图像相比,视频增加了时间线索,比静态图片更为复杂,应用传统的视觉注意模型对其进行处理容易丢失运动信息。同时,视频的数据量相对较大,需要算法有较高的提取速度,否则就没有应用价值;但算法在高效的同时,需要有良好的精确度,否则也不适合应用。本文在国内外研究的基础上,提出了一种全新的快速准确的视频感兴趣区域提取算法,并将其应用到视频压缩编码中,主要工作如下:(1)介绍了ROI提取方法的研究现状,根据应用需求,选择基于视觉注意模型的方法作为研究重点。详细阐述了三种视觉注意模型的基础知识,对它们的运算速度和提取结果进行比较分析,选择速度最快的SR模型作为本文的研究基础。(2)对于实验需要的视频,设计眼动实验,通过筛选处理眼动数据,得到有效的注视数据,通过高斯模拟分布得到眼动ROI,将其作为视频图像的真实ROI,作为评判其他方法准确度的标准。(3)从空间和时间信息两个方面对SR模型进行改进。在空间方面,通过对显著性信息在频域的分布特点进行分析,在模型中加入高斯核与幅度谱卷积的结果;SR模型只针对图像的灰度特征进行处理,在此基础上,加入颜色特征,并通过超复数傅里叶变换将其作为整体处理,节省计算时间;利用视频的时间信息,分析图像的相似程度,只对存在较大差异的图像进行计算,节约重复处理的时间。在时间方面,采用三帧差法进行运动特征提取。最后,将两个结果进行融合分割,得到最终的ROI,并通过客观的指标评价算法的准确度和效率。(4)在H.264编码标准中应用本文算法,通过PSNR对压缩得到的视频质量进行分析比较,发现应用ROI进行压缩编码可以在码率相同的情况下提高视频质量。本文基于SR模型,提出了一种全新的视频感兴趣区域提取算法。实验结果表明,本文算法提取的ROI与介绍的三种视觉注意模型相比,更加接近眼动ROI。同时,本文算法处理分辨率1920×1080、时长10S、帧率30FPS的视频所需时间为15.4S,与SR模型12.5S的处理时间接近,满足快速应用的需求。