基于卷积神经网络的图像语义分割研究

来源 :青岛理工大学 | 被引量 : 1次 | 上传用户:kukuhenku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在计算机视觉领域的发展,基于深度卷积神经网络(CNN)的语义分割算法也取得了巨大的进步。图像语义分割在医学图像处理、地理信息系统、自动驾驶、机器人视觉等方面都具有广泛应用,这项技术受到了学者们越来越广泛的关注。图像语义分割任务是检测并标注出图像中的目标物体,描绘出每个物体的边界,最终得到一幅具有像素级语义标注的分割图像。图像语义分割技术主要包括基于传统特征提取的方法和基于深度学习的方法。基于深度学习的语义分割方法主要存在两个难点:(1)语义分割不仅仅要实现像素级分类,还要实现对前景目标的定位,由于卷积神经网络自身固有的平移不变性,这种对空间的不敏感特性,使得网络对前景目标的定位比较困难。(2)卷积神经网络中不断的下采样操作,使输出的特征图分辨率越来越小,信息丢失严重,导致像素点分类不准确。针对上述的问题,本文主要做了以下工作:1.为了使前景目标的定位更加精确,在现有的Deep Lab V3+网络中引入了注意力机制模块(Convolutional Block Attention Module,CBAM),提出了Attention-Deep Lab分割网络。CBAM模块分别学习特征图的通道注意力和空间注意力,通道注意力可以强调每个特征图中重要的细节特征,空间注意力可以更好地帮助网络定位目标的位置。通过引入注意力机制模块,Attention-Deep Lab达到了更加精细的分割效果。2.为了实现更精确的像素分类,本文提出了间隔余弦损失函数,为每个类别引入余弦间隔。现有的语义分割模型通常都使用传统的softmax loss作为损失函数训练网络,然而softmax loss仅仅关注类间间隔,而忽略类内方差。相比于传统的softmax loss,基于间隔的余弦损失函数不仅仅优化类间距离,同时优化类内距离,使得不同类别之间的决策边界更加鲁棒。3.本文在一些公开的基准数据集上(PASCAL VOC 2012、Cityscapes、ADE20K)进行了充分的实验,分析了每一个模块的效果,实验结果表明本文提出的方法取得了更加优异的性能。
其他文献
随着电子商务的发展,人们对快递的应用和需求愈发强烈。如何快速分拣来自各地的快递件,提高工作效率已经成为目前快递行业面临的重要问题。在分拣过程中,人工分拣会造成暴力
用户偏好的学习,例如条件偏好网(Conditional Preference networks,CP-nets),已经成为人工智能研究的核心问题。当前的研究大多是从随机选择的示例或对等查询中对CP-nets进行结
随着科学技术的发展,诸如遥感、无人驾驶和目标识别等方面的计算机视觉应用变得越来越广泛,但是在有雾天气下获取的户外图像会受到雾气的影响,导致图像质量受到严重的退化。
Global Navigation Satellite System,简称GNSS(全球导航卫星系统)广泛应用于社会生活生产及经济活动中,如智能交通、互联网、移动通信、水文测绘等产业中,因此众多国家纷纷
移动边缘计算(Mobile Edge Computing,MEC)系统中,任务卸载策略作为系统的核心功能之一,自出现以来就受到了学者们的广泛关注。众多学者针对这一问题进行了研究。目前已有的
在过去的十几年里,单幅人脸图像的三维重建技术在计算机视觉和图形学领域中获得了很多的关注,其中自编码体素网络由于其轻量级、端到端以及受到模型表达的限制较小的优势在近
利用基底材料及外包覆纳米材料的表面增强效应可使被检测的物质或分子的发光光谱强度提高若干个数量级,这个特性已在拉曼增强光谱研究领域受到了海内外研究者的广泛关注并得
随着清洁能源的普遍应用,双有源桥变换器(Dual Active Bridge,DAB)倍受关注。由于DAB拥有效率高、能量双向流动、软开关、电气隔离等优点,因此在固态变压器、电动汽车、能量路由器和不间断电源中得到了广泛的应用。因此本文以DAB为变换器拓扑,提出了一种新的优化调制策略以及一种新的闭环控制策略。本文详细的分析了单重移相控制、扩展移相控制和三重移相控制的调制方式、软开关特性和功率特性。在
移动机器人导航技术是当今人工智能领域的研究热点,包括建立地图、定位、路径规划等。为了赋予智能移动机器人自主学习的能力,实现和增强移动机器人局部路径规划功能,需要结
如今人口老龄化加剧,用于护理任务的机器人需求很大。护理机器人的关键技术难点在于其关节对大负载的承受能力,和在执行护理任务时的安全性。本文为用于病房中移动病人的护理