【摘 要】
:
图像语义分割通过对图像进行像素级的分类,可以实现计算机对复杂场景的解析,一直是计算机视觉领域中的研究热点和难点。近年来,图像语义分割被广泛应用在包括自动驾驶、室内导航、辅助医疗在内的不同场景中,受到了越来越多研究者的关注。对于自动驾驶而言,街景道路场景下的语义分割技术对其有着重要的指导意义和研究价值。目前实现端到端语义分割的方法主要基于深度卷积神经网络,但大部分算法依赖于巨大的参数量和计算量,在实
论文部分内容阅读
图像语义分割通过对图像进行像素级的分类,可以实现计算机对复杂场景的解析,一直是计算机视觉领域中的研究热点和难点。近年来,图像语义分割被广泛应用在包括自动驾驶、室内导航、辅助医疗在内的不同场景中,受到了越来越多研究者的关注。对于自动驾驶而言,街景道路场景下的语义分割技术对其有着重要的指导意义和研究价值。目前实现端到端语义分割的方法主要基于深度卷积神经网络,但大部分算法依赖于巨大的参数量和计算量,在实际应用场景中受限。为适应自动驾驶对实时和精度的需求,本文旨在设计一种高效且精确的轻量级街景道路图像语义分割算法,具体的研究性内容包括:(1)设计了一种层级特征金字塔注意力的轻量级语义分割网络EPANet。改进现有的特征金字塔池化(PPM)和空洞空间金字塔池化(ASPP)技术,设计了它们的轻量化实现;提出注意力引导分支(ARB)对特征金字塔作出全局特征引导,组合它们形成两种特征金字塔注意力模块(PWA和ASWA)。设计了层级深度特征融合策略,最大程度的保留并融合不同分辨率下特征图包含的类别信息和位置信息。对提出的两种网络模型EPANet-PWA和EPANet-ASWA在Cityscapes数据集1024×2048分辨率图像上进行验证,平均交并比m Io U分别为74.57和75.38,在TITAN Xp显卡上推理速度达到21.7fps和20.5fps,占用存储空间仅10MB和14MB。(2)基于第一部分的网络框架,构建了混合注意力级联的分割网络EPANet-MAM。特征图在经过对多尺度上下文信息聚合后,缺少对远距离像素之间的相关性表达,对此分别从特征图的空间和通道维度对其语义关联性进行建模,设计了轻量化的混合注意力模块(MAM),进一步改进特征表示;并设计了双辅助监督层,同时对网络的高层和低层特征表示进行优化。对提出的两种网络模型EPANet-PWA-MAM和EPANet-ASWA-MAM评估性能,平均交并比m Io U分别达76.51和76.67,推理速度18.0fps和17.3fps,占用存储空间15MB和19MB。(3)设计了一种基于高分辨率表征的轻量级语义分割网络HRPAnet。在特征编码过程中维持高分辨率表示可以捕获更多目标的位置信息,增强了分割网络对目标的定位能力。基于高分辨率表征的网络构架,设计了多路并行的特征金字塔注意力结构改进特征表示;设计了更具有稀疏表达能力的特征聚合层。通过实验证明了网络的优越性。
其他文献
本文针对铜-软铁复合弹带等离子堆焊焊接制造中,铜-钢界面成分控制和软铁-钢的熔深控制难题,引入热丝加热纯铜和纯铁的方法,进行交替双热丝等离子弧制造铜-软铁复合弹带工艺研究。力图解决冷丝工艺制备铜-铁复合弹带时存在钢基体熔化量较多、熔深较深的问题。并深入对比分析冷丝工艺与热丝工艺制得的弹带在显微组织、界面处元素分布、显微硬度和弹带剪切性能方面的差异,获得铜-软铁复合弹带的性能控制规律,从而为复合弹带
随着计算能力的大幅提高,深度学习迎来了热潮,在各种领域都取得了巨大的成功。特别以卷积神经网络为代表的深度神经网络在图像、文本以及语音等应用中都取得了令人意想不到的效果,这也得益于卷积神经网络强大的建模能力。然而卷积神经网络只能处理欧式数据,对于图这类非欧式数据是不适用的。图数据的应用广泛,诸如社会分析、蛋白质结构预测、交通流量分析等任务都需要将数据建模成图结构。随着图的研究越来越深入,传统的机器学
钨合金是以钨为硬质相,以铜、镍、铁等过渡族金属为粘结相的一种复合材料。由于钨具有强度和硬度高、热膨胀系数低以及耐腐蚀性、辐射屏蔽性好等一系列优异性能,钨合金被广泛应用于航空航天、电子、核工业和国防工业等领域。但钨的高硬度、高熔点和室温脆性使钨合金难以通过传统机械加工工艺成形,目前主要通过烧结工艺来制备。然而,该工艺存在生产时间长、成本较高、无法成形复杂形状零件等不足,限制了钨合金的应用。激光直接沉
中国工业化与城市化快速推进的同时,也承担着较为严重的环境代价,工业集聚与环境污染之间的关系逐渐成为生态经济领域研究的热点问题。既有研究多关注工业集聚的环境外部性问题,而少有学者研究环境污染对工业集聚的反向作用。目前严峻的环境污染问题已经对居民生活质量和经济社会发展造成了严重影响,同时,其对地区工业集聚造成的影响也逐渐变得不可被忽视:一方面,环境污染严重影响着地区居民的身心健康,并进一步降低有效劳动
图像在生活中的各个方面都有应用,如民用领域的医学成像、电子监控、人脸识别、遥感航空航拍、指纹分析、机器人视觉和自动驾驶、智能小车等,以及军用领域的坦克、装甲车、火炮、导弹、BAT子弹药都有体现,但是在图像的采集或存储运输时,由于环境条件、设备条件或传输压缩等原因,图像质量会出现下降,为了精确地分析图像,我们需要进行增强处理。本文对目前图像增强方法的研究现状进行分析,传统的基于暗通道先验算法存在边缘
氟化钙材料因其优异的光学性能成为不可替代的光刻系统透镜、红外窗口材料,而传统加工难以获得高质量表面。为获得高质量氟化钙表面,须对氟化钙材料去除机理进行研究,为此须研制纳米划痕装置。同时该装置具有热辅助功能可实现氟化钙材料的改性加工。本文从纳米划痕原理出发,将精密压电驱动与柔性铰链结构相结合设计出了能同时感知切削法向力和刀尖位移大小的可调温热辅助纳米划痕装置;借助有限梁单元建模方法对力感知单元柔性铰
随着激光功率的提升,光波导中的热管理问题、应力效应及非线性效应已成为限制激光输出功率和系统稳定性的瓶颈。具有大模场面积的光波导凭借优异的热管理能力、低传输损耗及大功率容限等特性,为高功率激光器的应用和发展开辟了新天地。本文针对大模场光波导亟需解决的关键问题,开展结构设计和理论研究,以设计分析和数值仿真为主要手段,设计并研究了多种单模、大模场输出的光波导。针对高功率固体激光系统的应用,设计了一种大模
为满足军事智能化发展需要,实现我国百年建军奋斗目标和国防、军队现代化的要求,随着战争打击呈现出越来越强的非接触、精确化、信息化、体系化等特征,精确制导武器作为实现战场目标打击的主要装备,几乎融入了当今信息时代所有最新的科学技术,特别是以制导技术为核心的高新技术发展成果。弹丸飞行姿态这一关键参数的准确测量是实现精确制导的重要前提和必要保障。为降低对卫星导航的过度依赖以及由此产生的风险,近年来卫星拒止
自然界中的许多物体在运动时,除了目标主体的平动外,还具有振动、摆动、旋转等微运动并在多普勒频率周围产生额外的调制,这种现象就是微多普勒效应。作为目标独一无二的特征,微多普勒效应可以作为目标识别的依据。而随着现代飞行控制技术的进步,无人机进一步发展,被广泛用于进行地面目标监测与侦察,而这些应用的前提就是无人机载雷达能够对地面目标进行准确分类。因此,本文重点研究了无人机载雷达对轮式车辆、履带式车辆和行
目标检测的准确性对于无人驾驶车辆的安全性和智能性起着至关重要的作用,其中,恶劣环境下无人驾驶车辆目标检测的准确性主要依靠对降质图像进行图像增强得以保证。本文开展在低照度、雾天等恶劣环境下面向无人驾驶车辆目标检测的图像增强方法研究,主要研究内容如下:1.开展一种基于改进Retinex算法的低照度RGB图像差值增强方法研究。该方法结合空间转换提升运行速度;利用Sigmoid函数替换多尺度Retinex