论文部分内容阅读
近年来计算机视觉取得了极大的进展,其中源于生物视觉系统的视觉选择性注意机制受到了广泛的关注。通过模拟人眼视觉系统从一个复杂场景中提取出易引起观测者注意的图像信息,能够像人眼一样将场景中与周围环境有巨大差异的区域自动提取出来,并屏蔽掉多余的背景信息,极大的降低了图像处理系统的负担。此方法在目标检测中应用可以大量简化计算量并提高整个检测系统的实时性。因此,基于视觉显著性目标检测的这一优点,在图像处理中显著性检测常被作为预处理的手段为复杂的图像处理任务提供必要的位置信息,其中在图像的分割、目标的跟踪识别以及图像内容感知的压缩等领域具有重要的理论研究与实际工程应用价值。目前在复杂背景的图像目标提取、分割、压缩感知等处理中,应用视觉显著性特征方法的研究还较少,通过前期大量的文献查阅工作以及实验发现已有的方法都是基于单一域进行显著目标的检测,在复杂背景下普遍存在检测准确率低及检测速度慢的缺点。因此本文主要研究了基于空频域模型结合的显著目标检测方法对复杂背景下大、中、小以及多个目标的检测性能,力求寻找到检测准确率高且计算速度快的综合性能优秀的算法。首先本文将视觉显著性目标检测的发展历程以及研究的意义分别进行了详细地介绍,并对人眼视觉系统的视觉注意机制进行了深入的研究与分析,在此基础上对视觉显著性目标检测的已有模型进行了研究,分析了各模型的特点以及主要的应用,并提出了本文将空间域与频率域的显著性检测模型进行融合的检测路线。在总结分析了现有模型的优缺点后,确定了本文所要选取的空间域显著性检测方法及频率域的显著性检测方法。本文将空频域方法进行融合以达到可以使空间域的局部信息与频率域的全局信息进行信息的优势互补得到更加全面的显著区域信息,提高视觉显著性目标检测的准确率以及普适性。考虑到融合后模型的检测准确率及实时性的要求,在本文中分别对空间域和频率域的显著性检测模型在多尺度融合的思想下进行了改进和优化。在频率域的显著性检测方法中对HFT方法做了速度优化,在不影响检测准确率的基础上使得检测的准确性及时实性得到较好的提高;在基于空间域的检测方法中,在现有GBVS方法的基础上在特征提取部分也进行了多尺度融合,并且利用颜色、亮度、方向等特征进行了有向图的确定,既提高了检测准确率又节省了时间。通过对两个域中的模型进行优化和改进,使得新模型在图像处理中具有更好的检测性能。最终将两个域的显著图利用加权平均的融合方式进行结合,使得结合后的理论模型能够做到信息上的优势互补,并能适应复杂背景下的目标检测任务,得到更高的准确率和更快的检测速度,整体的检测性能有极大的提升。通过实验表明,与单一域的显著性检测方法相比,本文提出的视觉显著性目标检测的新模型检测效果超过了单一理论基础的方法,在准确率上相对于GBVS模型及HFT模型分别提高了9.5%,6.3%,且没有在运算时间上造成额外的消耗,达到了检测准确率高,适应性强,且模型计算快的应用要求。为了验证新模型的适用性,在图像分割和图像背景虚化中做了实际图像的应用,并取得了良好的效果,证明此模型在以后的实际图像处理及工程中有很大的应用前景。