论文部分内容阅读
近年来,随着智能终端设备的普及,图像数据呈爆炸式增长,快速有效地获取图像中的有效信息将很大程度上提高我们的工作效率。由于存在视觉注意力机制,人类在面对一个场景时会首先关注我们感兴趣的目标,并忽略那些背景信息,这有利于提高大脑的信息处理速率。显著性目标检测就是用智能算法来模拟这种注意力机制,让计算机自动识别并分割出图像中的显著性目标。显著性目标检测在自动驾驶、监控安防以及图像检索等领域都有很广泛的应用,因此其研究价值很高。本文针对显著性目标检测领域还存在的一些问题进行研究,并提出了以两种显著性检测模型:基于边缘约束的显著性目标检测模型和基于生成对抗网络的显著性目标检测模型。基于边缘约束的显著性目标检测模型的网络结构为一个改进的U形网络(U-Net),其可以充分地将图像的深层语义信息与浅层特征相融合,并且我们基于图像卷积提取目标边缘的思想提出了一个基于边缘约束的损失函数。该模型解决了当前显著性目标检测中目标边缘模糊以及目标内部各区域预测分数不一致的问题。我们的实验是在五个基准数据集上进行的,其中测试数据集三个,并且选择了十一种模型进行对比。实验结果显示我们的模型检测的显著性图具有优于其他模型的目标边缘和检测精度。在DUT-OMRON数据集上,我们模型的F度量值比对比模型提升了3.77%。基于深度学习的显著性目标检测模型在训练时都依赖于特定的损失函数,那些不能在这些函数中体现的图像信息往往没有利用到。当前的许多显著性目标检测模型(尤其是传统模型)都只在特定的条件下适用,常常对于输入图像中显著性目标的大小以及数目有限制。为了解决上述问题,我们基于生成对抗网络提出了一个显著性目标检测模型,即用条件生成对抗网络学习一个从自然图像域到显著性图域的映射。在训练时,生成网络输出尽可能真实的显著性图,而判别网络将其与真值图(Ground-Truth)尽可能地区分开。判别网络在判别真假显著性图时会综合考虑图像的各种信息,其判别分数会引导生成网络的训练,因此判别网络相当于生成器损失函数的一部分。此外,根据矩阵与自己做乘可以扩大矩阵间差异信息量的思想,我们还提出了一个新的空间约束项。我们的实验是在六个常用数据集上进行的,并且选择了十一种对比模型。实验结果表明,生成对抗网络在显著性目标检测任务中也可以取得很优异的表现。