论文部分内容阅读
随着移动存储技术和互联网技术的快速发展,全球图像视频数据正在呈现爆炸式增长。这些图像和视频的信息量已经超过计算机所拥有的计算能力,给视觉大数据处理技术提出了新的挑战。人类可以从大量的视觉输入中定位出少量最重要的视觉信息,然后对其进行分析和处理。人们希望智能信息处理系统具有人类这种从粗略看到精细看的能力。视觉显著性计算方法就是模仿人类的粗看过程对视觉信息进行有效筛选,而显著性物体分割就是模仿人类的细看过程为场景理解奠定基础。本文在现有研究的基础上,对视觉显著性计算和显著性物体分割展开深入研究。首先,在含有复杂背景的自然图像中,单一尺度下的局部显著性线索不能对图像中的整个显著性物体进行有效的描述。针对该问题提出了一种金字塔融合的视觉显著性区域检测算法。将图像分解为互不相交的区域并以此为图像显著性分析的基元,在此基础上提取各区域的颜色并计算该分割区域的平均颜色用来进行区域的表示。在同一尺度下构建两种全局显著性线索包括全局区域颜色对比度线索和全局区域颜色空间分布线索,采用非线性融合策略将这两种线索进行融合。借助图像金字塔将不同尺度下的显著性图像按照相同权重融合在一起。其次,针对低层视觉特征检测不完全的问题,提出了一种高层先验与低层特征融合的视觉显著性区域检测算法。构建一种基于区域合并的分层图像抽象表示,在此基础上计算图像的高层视觉线索包括图像的边界线索和中心先验线索,以及低层视觉特征包括颜色对比度特征和基于FCM的区域颜色分布特征。并设计出有效的融合策略将不同的视觉显著性特征进行融合,在同一尺度下进行递进式和启发式相结合的融合策略,在不同尺度下则采用基于信息熵的融合策略,实验结果表明该方法可以对背景区域有很好的抑制效果。再次,为充分考虑各视觉线索之间的交互关系,提出了一种特征组合和学习的视觉显著性区域检测方法。从四个方面提取区域的显著性线索作为原子特征包括区域的对象性特征,基于GMM的颜色分布特征,基于边界和中心的稀疏编码特征和区域颜色对比度特征。利用一种新颖的特征组合策略将4维特征向量映射为15维特征向量并训练一个logistic分类器来区分显著性区域和背景区域。在检测阶段采用多尺度进行显著性图像的增强操作,在公开数据集下的实验表明提出的算法可以生成高质量的显著性图像。最后,提出了一种基于显著性种子点和随机游走的物体分割算法实现自动物体分割。第一阶段利用显著性检测结果生成初始的种子点并结合SVM分类器对这些种子点进行重新标记;第二阶段将生成的种子点结合随机游走算法实现物体的自动分割;第三阶段利用数学形态学中的腐蚀和膨胀操作对初始分割结果进行处理,可以将将孤立点和物体内部空洞去除。在公开数据集上进行了定性和定量分析,实验结果表明本文提出的算法可以取得较好的分割结果。