论文部分内容阅读
随着数码相机和智能手机等具有拍摄功能的设备的普及,数字图像和视频已成为人们日常生活中不可或缺的信息表现和传递沟通的载体。数字图像和视频呈现出丰富的内容;但对于计算机而言,它们只是由像素点组成,本身不显式含有物体结构和场景空间分布等信息。计算机很难像人一样从语义层面理解图像和视频的内容。视觉显著性基于视觉注意机制检测出图像和视频的显著区域,以人类视觉系统感知和处理信息的方式分析图像和视频的内容。根据视觉显著性的检测结果,计算机就能够区别对待不同显著程度的区域,自适应编辑和处理图像和视频。由于人类尚未完全理解视觉系统的生理构造,如何利用已知的视觉原理检测出视觉显著区域,已成为计算机视觉和图形学领域的重要研究课题。在视觉显著性检测过程中,由于衡量视觉差异的方式不同,不同算法的显著性检测结果差异很大。如何根据视觉原理检测出满足实际应用需求的视觉显著性值得深入研究。本文主要研究基于区域对比度的视觉显著性检测算法。该算法利用自底向上的视觉注意,根据图像和视频自身的内容检测出轮廓和形状更清晰的显著性图,更符合实际应用的需求。本文首先总结了图像和视频显著性检测算法中主要的视觉注意原则和常见的视觉特征,包括颜色、亮度、纹理、边缘、运动、频率等;然后从实际应用需求的角度分析了基于区域对比度的视觉显著性检测算法的合理性和可行性。与图像相比,视频呈现的内容更加复杂,显著性分析也更困难;但是视频也提供了更多的显著性检测线索。在图像显著性分析的基础上,本文提出了一种基于区域对比度的视频显著性区域检测算法。该算法根据视频帧间关联性检测出类物体区域,并利用颜色、纹理和运动的综合特征和多尺度的区域对比度生成轮廓和形状更为清晰的显著性图。该算法综合考虑了空间和时间上的显著性影响因素,生成更符合实际应用需求的检测结果;并在公开的测试数据集上验证了算法的可行性。本文在视觉显著性检测的基础上,总结并拓展了视觉显著性的应用。根据显著性图的用途,宽泛地将视觉显著性应用划分为显著性引导的应用和显著性保持的应用。显著性引导的应用包括物体自动分割、自适应无缝融合、风格化等;显著性保持的应用包括图像灰度化、智能剪裁等。视觉显著性的应用也进一步验证了基于区域对比度的视觉显著性检测算法的有效性。