基于深度学习的图像语义分割关键技术与方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:hlly369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割技术(Semantic Segmentation)一直是计算机视觉领域中一个极具挑战性的任务,在图像理解中起着极其重要的作用。图像语义分割集合了图像分割与图像识别两个领域,其目的是能精确地分割目标物体,并对图像中的每一个像素点赋予一个语义标签。近年来,深度学习(Deep learning)在计算机视觉中扮演着极其重要的角色,其具有高效的自动特征提取功能,通过对低层次的特征进行组合,组成高层次的特征,并得到不同特征之间的空间相关性,这使得深度学习算法在提取图像的全局特征信息和局部特征信息方面具有很大的优势。基于这些特点,深度学习也为图像语义分割问题提供了新的思路。由于卷积神经网络深层提取的特征虽然有利于图像识别,但丢失了大部分像素信息,不利于端到端的分割,而浅层提取的特征虽然保留了大部分像素信息,但是特征提取不充分,不利于物体识别。基于这些观察以及目前的研究现状,本文主要进行了如下研究:(1)本文设计了一个深度上下文卷积神经网络(Deep Context Convolutional Network,DCCNet),它能以一种整合的方式去组合来自网络不同层的特征信息进行语义分割。DCCNet的分割结果然后再通过全连接的条件随机场(Dense Connected Conditional Random Fields,Dense CRF)进行后处理,在分割时,将图像中像素点类别之间的联系考虑进来,从而进一步提高图像的语义分割性能。(2)本文提出一种新的编码-解码的网络结构,叫做稠密反卷积网络(Dense Deconvolution Network,DDN),该网络卷积网络部分深层的特征通过不断的上采样作用于反卷积网络部分的浅层。DDN通过端到端的训练,能全面的探索图像中嵌入的多尺度上下文信息。(3)本文最后提出了一种模型压缩算法。由于深度卷积神经网络(Deep Convolutional Netural Network,DCNN)模型参数量过大,使得网络占用了太多的存储资源,无法应用于移动端和嵌入式芯片上。基于分析,本文提出来一种低Bit量化算法来对模型参数进行量化,从而实现模型小型化。实验结果证明,本文提出的以上方法在PASCAL VOC2012或者SIFTFlow数据集上的分割性能要优于其他分割算法。
其他文献
县域文化产业是文化产业发展的重要内容。藁城以宫灯为龙头的工艺品制造业,井陉以拉花为平台的文化休闲旅游产业.新乐以园区开发为载体、以动漫产业为代表的新兴文化产业的典型
计算机联锁系统中通常会设计有安全输出电路,用来保障计算机联锁平台的安全性能。在某些型号计算机联锁系统的安全输出电路中,会通过安全电源控制板对一个连续固定频率信号的
大型电力变压器现场吊罩大修对所有电力运行维护单位均是一项重大的检修工作,但就目前行业的情况来看,绝大多数电力运行维护单位均是将该项工作外包给相关检修企业完成,由于
研究多载具式自动化立体仓库的货位分配问题,可提高系统运作效率,降低成本。对双载具和三载具两种设备配置下的货位分配问题进行分析,根据存储系统实际运作情况,考虑堆垛机在
针对乘务员携带行车资料的不易管理和使用、途中故障不能及时有效处理、指导司机不能充分发挥管理职责、乘务员学习方式单一等问题,以基于Android系统的高效智能搜索引擎技术
随着移动互联网的广泛部署,智能终端结合各项计算机技术的迅猛发展,基于位置的服务也顺应了时代的发展,位置服务已经成为了人们生活中必不可少的一部分,因此研究人员相继提出