基于深度学习的机器人室外感知图像语义分割方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:dulizhi123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的蓬勃发展以及移动机器人的普遍使用,自动驾驶逐渐成为人们研究的热点。环境感知是自动驾驶技术中最重要的一环,而环境感知的目的是为了区分环境内容,因此,精确、高效的图像语义分割方法越来越重要。本文将针对基于深度学习的机器人室外感知图像语义分割方法进行研究,提出一种在保证准确率的情况下能够加快网络运行速度的语义分割网络模型,以及一种能够增强边界信息的高精度语义分割网络模型。本文主要研究内容如下:首先,研究了卷积神经网络的重要组成部分以及每个具体操作的原理;分析了几种具有代表性的图像语义分割网络模型;设计了本文模型所采取的图像预处理方式以及图像评价准则。其次,设计了多尺度特征融合的全卷积图像语义分割网络。提出了改进型多尺度模块以及改进型残差模块,并将其引入到本文的网络模型中;改进型多尺度模块,主要由普通卷积和空洞卷积组成,充分利用了空洞卷积的优势来得到图像的特征信息;通过对比分析批量归一化和组归一化的优缺点,创新性的将组归一化应用到残差模块中,并将能提高网络模型鲁棒性的Leaky Re LU(LRe LU)激活函数应用到残差模块中。为了使网络最后预测分割时的参考信息更加全面,本文在网络模型中加入了图像预处理模块。通过分析卷积操作与池化操作的优缺点,利用卷积的优势,设计了全卷积网络模型,并进行了对比试验,试验结果证明全卷积网络模型能够提高预测分割的精度。再次,设计了增强边界信息的编解码网络。本文将网络模型分为编码器和解码器两部分。通过分析双线性插值和反卷积这两种上采样方式的优缺点,设计了采用反卷积进行上采样操作的两种网络模型,并进行了对比试验,试验结果证明保留四倍和八倍下采样的特征信息与对应的特征信息进行融合的方式的效果更好。创新性的引用了残差链结构,将网络中提取的浅层特征先进行卷积操作,再与深层抽象特征相融合,从而减小融合部分的差异性来提高算法的精度。优化了网络的损失函数,即选择了一种能够缓解样本非均衡性的Focal Loss函数,并将其与传统的交叉熵损失函数进行了对比试验,试验结果证明Focal Loss函数更有利于模型的训练。最后,利用实验室的旅行家IV号移动机器人采集校园街道场景图像,并制作自己的数据集。利用制作的数据集对本文设计的网络模型进行了对比试验,并针对不同的应用场景进行了分析,试验结果证明多尺度特征融合全卷积网络模型更适用于简单场景下的预测分割,而增强边界信息的编解码网络模型更适用于复杂场景下的预测分割。
其他文献
能源和环境问题已引起全球关注,生产可再生能源、全面保护生态环境已成为科学研究的重点。半导体光催化技术(如光分解水生成氢和氧,利用光催化进行选择性有机物合成,利用光催化去除污染物等)被认为是解决能源短缺现象与环境污染问题最具前景的技术之一。为了使该项技术更好应用与人类可持续发展,一些研究者将目光转向新型光催化剂研发。单斜白钨矿型钒酸铋(BiVO_4)作为能响应可见光的新型光催化剂,具有成本低、无毒、
指代消解是自然语言处理的基本任务之一,对篇章的语义理解具有重要作用。现有研究主要集中于普通领域的文本,如:新闻通讯、广播对话、百科和博客等,对法律领域的指代消解研究关注较少。不同于普通文本,法律文本表述严谨、高度专业、富含知识。在庭审记录文书中,发言人具有一种至多种代称表述,实现发言人实体间的指代消解,对于法律文本分析具有重要意义。基于此,本文提出了一种融合标签表示的端到端指代消解方法,联合地进行
本文针对由制造商、零售商以及消费者构成的三级供应链系统,分别研究了由单一风险中性零售商和单一损失厌恶消费者组成的供应链系统以及由大型多元化风险中性垄断制造商和单
随着近年来互联网的发展,社交网络已成为实时信息的重要来源。根据中国互联网络信息中心发布的第45次《中国互联网络发展状况统计报告》,截止到2020年3月,中国现有网民数量超过9.04亿。与此同时,网络中产生的实时数据,其数量远多于现有的网民数。这些数据中,存在大量的不规范用语,如近音词、缩略语、书写变体等。本文对这些用语进行了充分的分析,并将其定义为非标准词。非标准词的出现,对自然语言处理下游的各项
龙沟河岩体位于黑龙江省东北部大兴安岭地区漠河县境内,该岩体产出的岩石类型为黑云母二长闪长岩等,在该岩体附近具有开采了多年的砂金矿,但是该岩体形成的物理化学条件以及岩石成因尚不清楚,成矿潜力也不明确。鉴于此,本文通过对该岩体的年代学、地球化学以及黑云母角闪石成分特征进行了研究,并对龙沟河岩体的岩石成因和成矿意义进行了分析。结果显示:(1)此次样品锆石U和Th的含量分别为711×10-6—2255×1
随着我国经济的快速增长,电子商务在我国得到了空前的发展,电商平台生鲜产品是近几年该领域发展的重要方向之一。但由于生鲜产品易腐烂、不易保存、地域性强等特性,众电商平
“入户抢劫”位列抢劫罪加重处罚情节之首位,其在刑法传统四要件构成要素的框架内的认定标准应当包括:“入户抢劫”所侵犯的客体应当包括公民的人身权、财产权以及住宅不受侵犯的权利;犯罪所指向的对象,即“户”是指供相对固定的成员个人长期生活的居住场所,并与外界相对隔离,具备居住特征和场所特征,“入”的方式包括任何违背被害人的意愿的“入户”行为,包括暴力方式和较为平和的非暴力方式;主观目的上要求行为人在“入户
随着我国经济市场的不断改革与人们需求的不断变化,越来越多的中小型制造业企业开始发展起来,食品加工企业作为制造业产业市场的重要组成主体,面临的竞争也越来越激烈,经济收益不断下降。成本控制作为公司降低成本,提高经济利润重要手段,公司成本控制的好坏是决定公司的运营发展好坏的重要因素。然而,当前公司的成本控制存在意识较低、管理水平较低、成本控制流程不合理等问题,已经很难适应现代食品公司的进一步发展,特别是
石墨相氮化碳(g-C_3N_4)虽具有优越的物化性质,但由于具有较高的激子结合能和光生电子-空穴对复合率高,限制了其光电催化应用,因此,需对g-C_3N_4进行改性以提高其光电催化性能。本文采用半导体复合及元素掺杂改性方法制备了几种改性氮化碳纳米材料,将其用于光电催化产氢及光降解有机污染物,效果明显。具体工作概括如下:(1)采用苯并三氮唑(BTA)为碳源,三聚氰胺为前驱体,使用热缩聚法制备了碳掺杂
在第五代通信系统(5G)中,人们对于短视频、直播、高清电影等多媒体视频资源的需求与日俱增。并且,高清视频资源的传输会给日益紧张的带宽资源带来更大的压力。所以,现在需要高可靠性及高数据压缩率的视频传输系统。SoftCast是一种跨层传输的信源信道联合编码的线性视频传输系统,极化码是唯一理论证明可达香农容量的编码方法。并且,SoftCast中的Hadamard变换与极化编码中的信道极化过程结构相同。基