基于深度学习的城市街景实例分割算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lantaiwin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车的普及和人民生活水平的提高,以及人工智能和计算机视觉技术的快速发展,智能汽车、自动驾驶成为人们对未来生活的新需求、新憧憬。感知环节作为自动驾驶系统的组成部分之一,为后续的决策和控制环节提供重要的信息,对于普遍存在的城市街景的环境感知效果则成为非常关键的问题。实例分割作为一种更符合人感知环境方式的技术能够帮助感知环节更好地建立对场景的理解。本文基于深度学习对城市街景的实例分割算法进行了研究,主要工作如下:首先,本文对双阶段实例分割网络进行网络结构轻量化的设计。分别通过Mo-bileNetV1、MobileNetV2、MobileNetV3三个网络,引入了深度可分离卷积、反残差线性模块、SE模块等结构。并与特征金字塔网络(FPN)结合进行多尺度信息的融合,作为双阶段实例分割算法的特征提取部分。其次,鉴于个别类别在数据集中缺乏的问题,本文通过COCO数据集的预训练提升网络的特征提取能力。最后,本文基于不同的算法方案,对非极大值抑制进行了改进,分别使用了 Soft-NMS和Fast-NMS两种方法。Soft-NMS在传统非极大值抑制的基础上,引入了 BBox置信度降低的机制,而Fast-NMS则通过矩阵计算和筛选机制的放松,对传统非极大值抑制进行了改进。本文实验采用Cityscapes数据集中的城市街景图片对算法进行训练和后续的验证,并分别评估了各算法方案的精度、速度和可视化效果。通过实验,MobileNetV3与FPN相结合,并经过COCO数据集预训练的方案获得了略高于Mask R-CNN的精度,且在其基础上提高了模型的预测速度,降低了模型的参数量和计算复杂度。而Soft-NMS和Fast-NMS两者在不增加网络参数量和训练难度的基础上,分别有效地提高了模型的精度,和模型实例分割预测的速度。
其他文献
本文以西藏大学学生为调查对象,力求通过“点”的调研展现出我区大学生使用普通话和学习“双语”情况,并且从西藏大学2007、2008年普通话测试数据,全校14个专业随机抽样调查问卷
安庆铜矿高阶段大直径深孔采矿法(VCR法)采用潜孔钻机钻凿炮孔,施工过程中,岩碴埋钻事故时有发生,分析了事故发生的原因,提出了事故排除的方法.
企业战略需要适应各种各样复杂的环境变化。随着市场的变化,科特勒提出了顾客让渡价值理论,即顾客以让渡价值做为购买价值取向,决定购买及影响以后再购买决策的理论。这为企业经
目的探讨唐氏血清筛查联合无创DNA检测在产前筛查与诊断中的应用价值。方法对2016年2月至2017年11月来我院行产前检查诊断的2880位孕妇同时进行血清筛查和无创DNA检测,比较和
研究了一些半导体低维结构的压力光谱.测得平均直径为26、52和62nm的In0.55Al0.45As/Al0.5Ga0.5As量子点发光峰的压力系数分别为82、94和98 meV/GPa.表明这些发光峰具有Γ谷
义务教育地理课程是一门兼有自然学科和人文学科性质的基础课程,为借教材达成课程标准,教材中加入了地理活动,加之初中生的表现欲强,具备一定的感性知识积累,认知能力和表达
目的:分析研讨瑞芬太尼复合丙泊酚静脉麻醉在腹腔镜胆囊炎切除术的效果。方法:本次讨论中所研讨的76例患者均随机从2014年2月至2015年10月期间我院收治的胆囊炎行腹腔镜手术
招聘工作是民办高校人力资源管理工作的一项工作,影响着人力资源的整个管理工作以及学校的管理工作。当前我国的民办高校由于办学历史短、人力资源工作者专业知识缺乏,导致了在
前滚翻是低年级体操类学习的重要项目之一。在前滚翻教学中,教师要从密切把握学情,注重动作迁移,巧编动作口诀,巧用知识卡片,设计多元评价,联系生活实际六个方面进行探索与实