基于邻接依赖的逐层优化语义分割算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:nienie123nie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割是对对象类别,位置和形状信息的全面场景描述,在自动驾驶,医学分析和计算摄影具有广泛的应用。本课题研究了基于深度学习的语义分割算法。全卷积网络的引入,使得深度学习的方法远超传统算法的精度,但同时也存在一些网络本身所带来的至今仍未克服的问题,尤其高层语义信息和空间信息之间的矛盾。本文试图弥合低级和高级特征之间的差距,以优化上层分割过于粗糙的问题,从而显着提高分割质量。本文的研究内容可以概括如下:首先,针对网络为提取抽象特征而连续下采样导致的特征图分辨率过小的问题,本文利用不同扩张率的空洞卷积替换原网络中后端的普通卷积操作,既保持了各神经元感受野大小与网络对抽象特征的提取能力,又令分割结果的分辨率不至于太低。在此基础上,针对一般方法对图像像素独立预测的弊端,本文基于物体在局部上的特征表现相似往往同样在语义上呈现一致性的现象,提出了分层邻接依赖的概念。结合不同抽象表达的特征层中局部像素之间的依赖关系,把对像素的独立预测改为与周边像素的联合预测,使预测结果更紧凑,达到恢复分割细节信息的目的。其次,针对各层特征的组合优化问题,本文通过对各层特征分支在图像优化的效果差异研究,手动选择合适的特征分支,进一步用级联的方式使各层分支按由高到低、由粗到细的顺序依次对分割结果优化,计算方式简单高效,令修缮的效果起到一个叠加的效应,进一步提升了网络性能。最后,为使所选特征分支选择自动化,本文引入了针对像素级别的置信度策略,让网络在训练过程中自主的去选择合适的特征层,解决了在人工构建网络时因选取不佳的特征分支而影响分割精度的问题。与手动选择特定分支的方案相比,性能有略微提升。在PASCAL VOC 2012数据库上的实验表明,本文提出的语义分割算法与其他前沿算法相比,具有非常好的实验精度,尤其在细节恢复上有突出效果。
其他文献
近年来,散客游占出游总人数比重越来越大,巨量散客考验中国城市旅游服务体系。自助性质的短线游、一日游的旅游需求,催生了城市旅游集散中心的形成。2018年,国务院发文,提到要加快建设全域旅游集散中心。在旅游发展过程中,已有部分区域,建设了区域型的旅游集散中心。在实际运营中,部分已建成的区域型的旅游集散中心,存在空置率高、知名度低、经营效益差等问题。出现这些问题的主要原因是,区域旅游集散中心选址理论与方
随着生存环境的恶化,人们对环境问题的日渐重视,对于汽车尾气的管理也越来越严格,因此各大汽车生产商在研究尾气处理的同时,也在积极寻找内燃机的代替品,因此新能源汽车的发展被提上了议程。伴随着新能源汽车的发展,分布驱动式电动汽车作为最佳替代品受到了广泛的关注。但是分布驱动式电动汽车四轮之间相对独立,因此其电子差速问题仍是一个我们急需解决的问题。本文以轮毂电机直接驱动的分布驱动式电动汽车为研究对象,将车轮
随着机器人智能化程度的进一步提升,越来越多的机器人已经进入到学校和家庭,人工智能语音交互技术的飞速发展也逐渐引起了人们的高度关注。机器人利用听觉系统能够智能、简洁、高效和自然的与使用者进行交流,但是在获取语音信号的过程中或多或少都会受到室内环境噪声或混响等因素的干扰,所以为了解决干扰环境下声源定位系统定位精度低,实时性差的问题,本文对基于声达时间差的机器人声源定位问题进行了深入研究。本文建立了一个
不同形貌的碳材料,如碳球、碳膜和三维碳材料,具有各自独特的性质和用途。而简易高效的合成方法和合适的碳前驱体是制备碳材料的关键。因此,本文建立了水热制备碳球(CSs1和CSs2)、碳膜(CFs)和三维碳块(3D-CBs)的新方法,在此基础上研究他们的形貌、结构和性质并初步探讨了CFs在抗腐蚀、CSs1在吸附染料、3D-CBs作为电极在电容器方面的应用潜力,论文主要成果如下:以维生素C(Vc)为碳源,
央行的货币政策可以分为央行实际行动和央行言辞沟通两大类。央行实际行动有两大功能:一是实际作用功能,央行利用三大货币政策工具:即存款准备金、再贴现和公开市场操作进行宏观调控,以实现央行既定的货币政策目标。二是实际行动的信号功能,央行实际行动在公布和执行的过程中,也会向各微观经济主体传达货币政策调整的信号,进而影响经济主体的预期和决策。央行言辞沟通与实际行动的信号功能有相近之处,但央行言辞沟通一方面是
本论文研究方向是如何基于人机工程关系来进行手持云台产品的设计研发。以仿真优化的人机理论方法为核心,研究应用技术辅助手持云台的设计研发的方法,选取的研究对象为手持云台——一款影视行业最常用的辅助视频拍摄的产品。目前手持云台依据装载摄影设备类型的不同,而分为专业级手持云台与非专业级手持云台,而本文主要研究的则是专业级手持云台。首先,手持云台主要采用的三轴增稳系统,可以帮助摄影机、相机、手机等产品更稳定
近年来,移动通信技术得到了迅速地发展,同时移动智能终端也越来越普及。一方面,数据流量爆炸增长,而这其中增长更加快速的是以多媒体信息为主的移动数据流量;另一方面,终端处理能力之间的差距逐渐增大。因此,在面对数据流量爆增、终端处理能力差距逐渐增大、以及链路质量具有差异性的情况下,研究如何解决因链路质量差异和终端处理能力差异导致的实时差异化数据传输问题,对于为用户提供更好的服务具有重要的意义。本文先是介
在网络技术为代表的知识信息社会,马克思主义科学技术理论依旧指导着我们的科技实践活动。科学技术具有两面性。科学技术的价值体现在它作为第一生产力,可以提高人们的生活水平,加速社会发展进程。同时,科技的发展可以提升人们的认识水平,促进人的全面发展。然而,科技活动中也有一些社会问题伴随产生,这些就是科技发展的某些异化现象,主要表现为人的主体性丧失、道德沦丧和意识形态危机。求知是大学生的首要和根本任务。随着
在无线移动通信系统中,多址接入技术可以分为正交的和非正交的,其主要区别是非正交的多址技术用户可以对资源块进行复用。多址接入技术会随着无线移动通信系统的更新而发展。正交多址接入技术目前已经无法满足下一代通信系统提出的各种需求,如,超低的时延、数以万计的用户接入等。因此,非正交多址接入(Non-orthogonal Multiple Access,NOMA)技术凭借其多路复用的优点,成为面向5G通信的
随着计算机技术不断进步,互联网应用越来越广泛,网络在人类的生活和工作中扮演着越来越重要的角色。但是在网络给我们生活和工作提供便利条件的同时也带来了各种安全问题,因此网络的安全问题越来越受到重视,如何有效的评估网络的安全状况并及时的发现网络的安全问题已成为网络研究中的一个重要内容。针对网络安全问题,传统的防护手段是使用网络入侵检测系统、防火墙、防病毒软件或者脆弱监测系统等监测设备来对网络情况进行监测