基于上下文信息和层次结构的场景分割算法

来源 :天津大学 | 被引量 : 0次 | 上传用户:kency2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景分割在智能驾驶中有广阔的应用前景,目前针对智能驾驶领域的场景分割算法主要依靠语义分割实现对场景中物体的识别和理解。针对场景中目标物体的类别可以将其划分为两类:基于所有物体的场景分割和以人为核心的场景分割。
  在场景分割算法的设计上,提取具有判别力的上下文信息是关键。因此,本文首先提出了一种基于稠密金字塔和协同学习的语义分割模型,由局部上下文金字塔模块和全局上下文金字塔模块级联形成的稠密金字塔,能同时提取局部上下文信息和全局上下文信息,增强模型分割目标的能力,具体表现在物体的细节和边缘预测、小物体的分割、不同物体的区分上更加准确。除此之外,本方法设计了基于语义分割和目标分类的协同学习策略,进一步增强模型提取上下文信息的能力。该方法在Citysacapes测试集上取得了82.0%的mIoU,验证了所提出方法的有效性。
  在上述有效设计理念的基础上,本文进一步对以人为核心的更具挑战性的场景分割算法进行探索。人是智能驾驶领域中最重要的目标,对其进行人体细粒度分割有助于推进场景分割算法的发展。然而大部分算法没有利用人体自身的强结构性,从而限制了人体细粒度分割的发展。为了解决这个问题,本文将人体划分为三个层级,并利用直接预测、从上到下预测和从下到上预测对人体的每个层级进行推断,以此加强人体层次结构信息之间的流动。然后计算每个层级最终预测所对应的信息源的可靠性,利用条件信息融合将不同的信息源融合起来,生成最终的预测结果。该方法在LIP和PASCAL-Person-Part数据集上分别取得了57.74%和70.76%的mIoU,超越之前最优的方法,表明了所提出方法的先进性。
其他文献
人工电磁材料(超材料)作为一种新型材料自二十世纪末期开始被研究人员重点关注,该材料利用人工设计的特殊周期结构显现出一些奇异的电磁特性,这些特性主要有逆契仑可夫效应、逆多普勒效应和逆斯涅耳折射现象。并且,这些奇异特性使人们对人工电磁材料的未来发展愿景有了很大期待。在无线电波中有一个有限频带那就是微波,频率值为300MHz至300GHz之间,波长位于1mm至1m之间。微波本身属于电磁波的一类,因此波粒
异型零件的出现使工业化进程得以快速发展,但是其在生产和使用过程中不可避免产生带有缺陷的不合格产品,而现有的检测技术存在检测效率低、无法检测内部缺陷等问题。因此,开发并设计一种用于异型零件缺陷检测的新型无损检测系统,对预防异型零件在使用过程中产生损坏以及防止重大安全事故的出现具有十分重要的意义。  由于电磁层析成像技术(Electromagnetic Tomography,简称EMT)具有非接触、响
学位
广域信息管理(System Wide Information Management,SWIM)是国际民航组织(International Civil Aviation Organization,ICAO)推荐“航空云”的基础设施,作为美国下一代航空运输系统(Next Generation Transportation System,NextGen)和单一欧洲天空空中计划(Single Europe
波形识别技术,对于认知被动雷达、电子对抗以及无线网络安全等领域具有至关重要的作用。传统的波形识别基于特征提取的方法,典型的特征包括时频分布特征、分形特征和高阶累积量特征等。随着深度学习技术的日益成熟,神经网络的方法被广泛应用于波形识别中,并且性能大大超过了传统的波形识别方法。然而,实测过程中发现,对于在不同信道场景、不同采样率下的接收机采集的数据,已训练模型的泛化能力不理想,考虑到在线波形识别中信
单目标视觉跟踪是视觉跟踪领域中最基础的问题。它旨在根据给定目标的初始位置和初始信息,在随后的视频序列中估计目标的位置和尺度变化,以便完成更高级的任务。视觉跟踪任务的难点首先在于可获得的关于给定目标的训练数据非常有限。其次,跟踪模型面临现实应用场景中存在的遮挡、形变和尺度变化等诸多挑战。最后,视觉跟踪任务对处理速度的要求进一步提升了算法设计的难度。基于相关滤波的跟踪算法根据样本近似循环的特点,利用循
随着海洋在沿海国家的战略地位不断提升,对领海范围进行监测变得越来越重要,为了实现对领海范围内目标的监测,在国家重点研发计划基金的支持下,设计并开发了海上目标监测系统。海上目标监测系统是以任务为主线,利用无人机和卫星资源实现对海上某一段时间、要求成果类型、某一区域内目标的监测,系统主要包括无人机和卫星任务的规划,无人机拍摄视频的直播与回放,二三维地图的联动查看等功能。  系统采用前后端分离的开发模式
印前检测与校正是稿件印刷前的最后一道工序,此过程会检测稿件中的多个印刷参数,确定其是否符合印刷要求,对于不符合印刷要求的稿件进行校正,避免印刷阶段出现错误,此过程也是印刷领域的研究热点和难点。目前印前检测与校正领域存在以下几个难点:稿件检测项目较少且准确度不高,不支持对稿件错误项目进行修正或其他写入操作。检测与修正过程无法实现自动化,仍然需要人工处理每一份稿件。缺乏高效的稿件处理结果校验算法,依赖
随着互联网和多媒体技术的快速发展,图片数据呈几何式增长。其中有一些图片令人们印象深刻,有一些图片却容易被人们忘记。近些年来,研究者们发现这种现象可用图像可记忆度解释,图像可记忆度是图像的固有属性,旨在描述一张图片能够被人记住的程度。目前,对图像可记忆度的研究主要有两方面,一方面是研究影响图像可记忆度的因素,另一方面专注于对图像可记忆度的预测。现有的很多图像可记忆度预测方法通过简单的特征串联表征图像
虽然数码相机拍摄画质日益提升,在低光照或者高感光(ISO)模式下拍摄图像仍会不可避免的引入噪声。而且在很多情况下,需要调高相机的ISO进行拍摄,例如夜间拍摄或者捕捉快速运动的物体。该类实际噪声在空间分布和颜色通道上具有相关性,远比高斯噪声复杂,所以传统的高斯去噪算法难以有效去除该类噪声。鉴于此,本文从盲去噪的角度分析,充分利用卷积神经网络(Convolutional Neural Network,
学位
近年来,随着电子技术的飞速发展,阵列信号处理逐渐成为当前信息处理领域一个热门问题。阵列信号处理主要研究空间分布传感器阵列信号的信息处理问题,波束生成技术是阵列信号的基础,被广泛应用于通信雷达、图像处理、电力、机械振动、医学等领域。阵列信号处理所对应的信号分解和信号重构问题分别是空间谱估计和波束生成,但是在信息科技的发展过程中也不可避免的遇到了阵元间耦合效应加剧影响性能和软硬件成本提高这两个瓶颈问题