基于全卷积网络的像素级场景理解技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hebe2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景理解是计算机视觉中重要的研究课题,被广泛地应用于机器人自主导航、自动驾驶、无人机和盲人辅助系统开发等领域。场景中的深度信息和语义信息是场景理解的关键,对于单张RGB图像而言,可通过单目深度估计和语义分割来分别获取像素级别的深度信息和语义信息。近年来,基于深度学习的单目深度估计算法和语义分割算法取得了不俗的成绩,但是由于场景的复杂性和多样性,仍面临着诸多挑战。针对目前仍存在的一些问题,本文做了以下研究工作:
  针对单目深度估计和语义分割这类像素级密集预测任务,本文设计了一个端到端的基于全卷积网络的像素级场景理解算法框架,可独立应用于这两个任务。该框架采用编码-解码结构,以ResNet作为编码器进行特征提取,并利用空洞卷积增大感受野;解码器部分使用双线性插值逐步进行上采样,并对编码器和解码器中相同大小的特征图进行拼接融合,最后通过预测层实现密集预测。
  针对单目深度估计中场景空间结构和几何细节难以恢复的问题,本文设计了一种将深度、梯度、表面法向量等三个方面的误差结合起来的联合型损失函数,降低了预测的深度图模糊失真的程度。针对语义分割中不同类别边界难以划分的问题,本文提出了边界感知损失,利用边界信息进行显式约束,使得分割结果中边界更加清晰,物体的形状和轮廓更加规则。
  对于像素级密集预测任务而言,低级特征和高级特征都很重要,但它们的分辨率和信息层级差异太大,导致基于跳跃连接的特征融合方式存在不合理性。为此,本文提出了一种多尺度特征自适应融合模块,能够取代跳跃连接,可以灵活地应用到基于编码-解码结构的全卷积网络中。实验结果表明,相比于跳跃连接,该模块能够更有效地促进低级特征和高级特征的融合,使得单目深度估计算法和语义分割算法的精确度均得到提升。
  场景中的深度信息和语义信息具有相关性,可通过多任务模型同时获取这两种信息,来降低计算量并提高预测效率。为此,本文提出了一个多任务场景理解网络,可同时进行单目深度估计和语义分割。在该多任务模型中,单目深度估计和语义分割共用编码器,共享编码器的特征表示;对于解码过程,本文设计了独立式解码和交互式解码两种方式,分别对应于独立解码型多任务网络和交互解码型多任务网络。实验结果表明,交互式解码在两个子任务上都取得了比独立式解码更好的性能,并且交互解码型多任务网络也优于独立的单任务模型,这均说明深度信息和语义信息具有相关性和互补性,同时学习两种信息能够彼此促进,共同受益。
其他文献
【摘 要】“社会转型”既是高考命题的热点问题,也是高考备考的难点问题。本文以“明清社会转型”为例,以点带面,分析社会转型考察的内容及特点,提出相应的高考复习策略,增强学生学习的有效性。  【关键词】社会转型;明清社会;复习策略  【中图分类号】G633.8 【文献标识码】A  【文章编号】2095-3089(2018)15-0058-02  所谓社会转型指的是经济结构、政治体制、文化形态、思想观念
期刊
【摘 要】长期以来,文言文教学大多是刻板单调而缺乏生机的。教法上,重文言词句解释,轻文章思想情感感悟,不重视根据文本特点因材施教,课堂中师生互动较少,学生自主学习与探究能力得不到重视等,文言文成为教学中较为寡趣的板块。  【關键词】高中文言文教学;兴趣;能力  【中图分类号】G633.3 【文献标识码】A  【文章编号】2095-3089(2018)15-0066-01  新的教学理念中,重视学生
期刊
无线传感器网络是由大量分布在特定区域的无线传感器节点组成的,这些节点具有无线通信、传感、数据处理的能力,并以自组织方式组成无线网络,具有非常广阔的应用前景。在特定的应用领域中,无线传感器网络的安全通信是非常重要的。在无线传感器网络的安全问题研究中,密钥分配策略是目前研究的热点。由于传感器节点自身特点,许多传统的加密算法并不适合传感器网络,研究的热点也主要是密钥的预分配方法。本文分别对传统的ECC加密算法和密钥的预分配方法进行了研究,在此基础上提出了更有效的解决方案。 本文首先分析和研究了现有的密
【中图分类号】G410 【文献标识码】A  【文章编号】2095-3089(2018)15-0087-01  “我是奋进不止的学子,我充满理想;我是风华正茂的少年,我志坚如钢……”每天早上,从寺湾镇各学校门口走过的人都会情不自禁地驻足、倾听,一排排整齐的身影笔直地站立,一句句铮铮誓言振奋人心。  这是寺湾镇学生集体诵读励志信的情景。围绕每月励志教育主题所设计的励志信,每天早中晚各一次,一年四季,天
期刊
【摘 要】随着素质教育的不断推进,德育作为学校教育的根本,是素质教育的重要内容。小学课堂教育的核心是培养学生成人成才,抓住课堂,才能更好地开展全员德育工作。但是,小学德育活动的形式必须多元化,只有这样才能更好地适应现代化教育模式,促进小学德育工作与时俱进,肩负起塑造小学生健全人格的神圣使命。  【关键词】小学;德育工作;道德教育  【中图分类号】G718.3 【文献标识码】A  【文章编号】209
期刊
【中图分类号】G633.3 【文献标识码】A  【文章编号】2095-3089(2018)15-0094-01  近年来根据国家教育方针政策及工作安排部署,各类学校将培优补差这项工作提到了历史日程上来,并逐渐地被重视起来,我们中职校也不例外。但有相当一部分老师对这件事在观念上还存在着偏差。若不及时转变观念,改进方法,将使这项工程中途夭折。  从事中职教育教学工作多年,对中职生的生源情况也有了基本的
期刊
临近空间飞行器的控制问题是航空航天领域的热点问题,由于其具有强耦合、大扰动、非线性和快时变等特点使得其控制器设计也是一个难点。本文针对临近空间飞行器的姿态控制,在考虑系统不确定性和约束等问题的情况下,结合神经网络设计了不同的控制器。
  首先建立飞行器的数学模型。结合飞行器所处的飞行环境,从运动学和动力学两个方面建立了临近空间飞行器的基础数学模型。紧接着分析了模型不确定性并建立了含有不确定性的飞行器数学模型。在考虑系统的不确定性的情况下,设计了基于神经网络的动态面控制器。对于系统的不确定性做了简化,
目标跟踪技术是计算机视觉领域的重要分支,在智能监控、自动驾驶和军事国防等领域有着广泛运用,具有重要的研究意义与实用价值。其中,以相关滤波为基础的传统和深度跟踪算法成为近年来的热点研究方向,许多研究人员对其进行深入研究,取得了大量研究成果。但与此同时,其仍然面临着诸多挑战,在实际复杂应用场景中受到目标自身内部因素和环境外界因素等干扰,固定的跟踪模型往往难以应对跟踪时变因素(目标形变、目标遮挡、复杂背景等)带来的挑战。本文针对传统相关滤波算法和孪生网络系列跟踪算法跟踪模型自适应问题展开研究,并面向实际应用需求
水面无人艇是一种水面智能设备,其在执行各项海事任务或靠岸停泊时,需要实时感知周围环境的信息。而水面环境除了存在船只、浮标等具有目标性的物体,还存在岸体、码头等不具有目标性的物体,现有的基于目标检测或者海岸线检测的方法不能完整地解析出这些物体的信息。而语义分割是对图像像素级的分类,不受物体外观形状的影响,可以有效解析出水面环境中各类物体,为水面无人艇提供丰富准确的环境信息。因此,本文以无人艇应用需求为牵引开展了图像语义分割相关技术的研究。
  本文提出了一种基于多向卷积的上下文信息融合方法。上下文信息
随着卫星和遥感技术的发展,遥感影像的数据量也越来越庞大,超出了任何人工操作和处理的范围。因此,遥感图像的自动分析使这些图像在城市资源管理、搜索、海洋监察、海洋资源管理等实际应用中发挥重要作用。同时由于传感器技术的进步,获取到的遥感影像的空间分辨率不断变高,使得定位各类目标(比如,飞机、船只、车辆、港口等)成为了可能。然而,光学遥感影像不可避免地会受到各种因素影响,比如目标密集排列、外观相似和目标较小的影响,导致检测算法性能下降,给光学遥感图像的目标检测带来了较大的挑战。
  针对地面目标密集排列的情