基于深度学习的图像语义分割方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:weiqier1110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在移动互联网、大数据、大规模并行计算与脑神经科学等新理论与技术的驱动下,历经了数十年浮沉兴衰的人工智能技术迎来了新一轮的发展热潮。作为计算机观察、测量、感知与理解现实世界并与之交互的重要基础之一,计算机视觉技术得到了众多来自学术界与工业界研究者的关注。在众多不同的计算机视觉任务中,图像语义分割技术因其在像素级别对图像语义内容进行发掘而被广泛应用于语义边缘检测、场景理解、工业生产、自动驾驶等实际任务中。同时,深度学习和卷积神经网络相关技术的爆发也为图像语义分割技术的发展提供了良好的机遇,并助其不断取得突破性的进展。
  基于深度学习的图像语义分割技术在实践过程中经常面临数据问题和效率问题。一方面,语义分割模型通常需要有监督的训练,模型的性能会显著地受到用于训练的带有人工标注的数据数量的影响。由于语义分割模型训练的数据需要对图像中每个像素的语义类别进行精确地标注,故获取训练数据的成本高昂。对训练数据的依赖和获取训练数据的成本间的矛盾导致了数据问题。另一方面,语义分割模型普遍有参数多、开销高、延迟长等低效率的特点,难以应用在诸如增强现实、自动驾驶等软硬件资源受限的场景。尽管可以人工设计模型以匹配需求,但仍然难以高效地为多样化的需求提供定制化的语义分割模型。相对低下的模型运行效率和实践中模型定制化需求之间的矛盾造成了效率问题。本文针对上述的数据问题和效率问题进行了三项研究。为解决数据问题,本文采用无需人工标注的低成本计算机合成图像作为训练数据,围绕无监督情况下模型的迁移学习和域适应方法开展了两项研究,包括如何将合成图像与真实图像在底层表观特性和高层特征表达这两个层面同时进行对齐以实现模型的域适应,和如何利用图像语义分割结果中存在的固有属性对语义分割模型在真实图像上的推理结果进行正则化约束以实现模型的跨域迁移。为解决效率问题,本文研究了在约束条件下进行卷积神经网络结构的自动设计并自动平衡模型的语义分割性能与实际的约束条件的方法。
  论文的主要工作和创新点如下:
  (1)论文提出了一种用于图像语义分割的无监督域适应方法,以利用计算机合成图像在无需人工标注信息的情况下训练用于真实图像的语义分割模型。本论文提出了用于语义分割的全卷积自适应网络,该网络包含了表观特性适应网络和特征表达适应网络两大部件。前者在像素空间中学习两个域之间的转换模式,可以将源域图像变换为采用了目标域中图像的“样式”绘制而成的图像;后者以对抗学习的策略进行优化,以最大程度地利用学习到的源域和目标域图像的特征表达来欺骗域鉴别器,从而获得图像的域不变的特征表达。实验结果表明,本方法能充分发掘利用视觉表观层面和特征表达层面的规律,解决图像语义分割模型的无监督域适应问题。
  (2)论文提出了一种基于预测结果正则化的图像语义分割模型迁移方法。该方法地利用语义分割的内在属性针对性地设计正则化函数,以减轻语义分割模型迁移时的域失配与过拟合问题。本方法分别尝试在图像块、聚类以及空间逻辑关系三个层面对模型在目标域图像上的分割结果进行正则化约束。通过将这三个层面的正则化约束加入基于对抗学习的全卷积网络并进行联合训练,本方法可以取得显著优于现有方法的语义分割性能。
  (3)论文提出了一种图像语义分割模型的可自定义架构搜索方法,实现基于约束条件下的语义分割模型自动设计的目的。本方法地改变了现有模型架构搜索算法仅能追求最高的模型性能而无法将实际任务中的约束条件纳入优化目标的现状。本方法根据语义分割模型的实际约束条件,赋予每个候选项相应的成本,并在性能驱动的优化目标之中以损失函数的形式加入额外的成本约束项,进而帮助该方法在搜索性能最优结构的同时考虑相应的约束条件,最终实现语义分割模型的带约束自动设计的目的。本方法在Cityscapes和CamVid数据集上进行了详尽的评估,验证了其在模型性能与约束条件之间进行平衡的能力和自动设计高性能低延时语义分割模型的能力。
其他文献
摘要:地震勘探勘探是利用地下介质弹性和密度的差异,通过观测和分析大地对人工激发地震波的响应,推断地下岩层的性质和形态的地球物理勘探方法。地震勘探是钻探前勘测石油与天然气资源的重要手段,在煤田和工程地质勘查、区域地质研究和地壳研究等方面得到广泛应用。地震勘探野外施工是非常重要的基础性工作。必须精心施工,坚持质量第一。野外施工一般先要经过试验性工作,然后进行大批量的生产工作。  关键词:试验工作;波场
期刊
摘要:本文将从当前中职文化课教学的概况出发,阐述中职文化课与课程思政融合的作用,对中职文化课与课程思政融合模式进行分析与探究,希望为相关人员提供一些帮助和建议,更好地开展中职文化课教学,基于课程思政理念,促进中职学生的综合、全面发展。  关键词:教学融合;课程思政;中职文化课  引言:  十八大召开以来,课程思政逐渐得到各界人士的重视,尤其是课程思政在中职文化课教学方面的重视,课程思政对于中职教育
期刊
摘要:生命是大自然的设计和造化,大自然主宰了生命的设计,人类创造了文明社会并通过产品设计让人们的生活更美好,敬畏自然生命尊重生态体系建设理应是人类设计思想的初心。对自然生命的敬畏、探索和对审美、人性、科技和商业机会等人类文明的认知和传承而产生了有思想的设计、有灵魂的产品。  关键词:自然生命;文明;敬畏;灵魂;产品设计  “万物各得其和以生,各得其养以成,不见其事而见其功。”  一、生命是大自然的
期刊
在无线光通信(Optical Wireless Communications,OWC)中,为了满足高速通信需求,常常需要用到波分复用技术,通过采用许多不同波长的发射器和匹配滤光片及匹配光电探测器形成多波长并联通信链路来提高通信速率。当波长数目很多时,整个宽光谱内会存在大量的信道状态信息。而由于各个信道仅仅是波长不同,物理链路环境都是相同的,因此信道状态信息是冗余的,不同波长对应的信道状态信息是相关性很强的。如何利用这种信道相关性来设计适用于宽光谱通信的物理层设计,从而达到更高的系统性能或者更低的系统复杂度
摘要:数字化音乐教学是集听觉、视觉为一体的现代化教学手段。数字化音乐教学的出现,为现代音乐的快速发展提供了一个良好的平台,能够让学生更深刻地认识到音乐的内涵,增强对音乐的理解,提高音乐学习的兴趣。近年来,二胡的学习人数也不断增加,把数字化音乐教学手段应用到二胡的教学中一方面可以改变学生学习二胡的传统模式,另一方面可以让学生从多个维度增添對二胡学习的理解,同时也让教师在教学过程中理解学习者的心理特点
期刊
对于地面移动通信系统无法覆盖的区域,低轨卫星移动通信系统(Low Earrth Orbit Mobile Satellite System,LEO-MSS)承担了为移动终端提供通信服务的主要任务。然而LEO-MSS存在两个固有缺陷严重限制了它的通信服务能力,一是相对于地面移动通信系统,LEO卫星的单波束覆盖面积太大,其单波束覆盖半径能够到达百公里量级,约束了整个系统的总接入容量,二是LEO卫星对地快速移动,导致所有用户每分钟至少一次的频繁被动切换,大大增加了系统资源管理的难度,难以保障用户的服务质量(Qu
摘要:新课标指出,培养学生综合性能力是当前课堂教学首要目标,但是语文教学多以文章形式呈现,为此学生对文章的理解以及对作者情感的共鸣成为教学重点,在当前多元化的教学模式中,我们发现“课本剧”编演成为提高语文课堂教学质量的有效形式,“课本剧”不仅能够将不同素材、风格的文章以表演形式呈现在学生面前,还能加深学生对文章的体验感以及共鸣,且“课本剧”的编演,为学生提供了多种表现形式,将文学、表演、音乐等领域
期刊
摘要:大学生对社会的认知仍然处于懵懂状态,安全法律意识相对淡薄,在社交求职中往往是受骗的对象,各类治安案件时有发生,给学生的身心健康造成了一定的影响,不良事件的发生与学校的日常管理和安全教育宣传有着密不可分的关系,高校应充分认识到大学生安全法制教育的重要性,采取一系列相应措施来推进大学生的安全法制教育,来提高大学生的自我保护能力,构建良好的校园秩序,而高校辅导员作为大学生思想政治教育的一线工作者与
期刊
摘要:“从做中学”理论倡导的是学与做的结合,将学生置身于具体的活动情境中进行学习可以达到更优学习效果。文章以“甘肃省天水市麦积山景区”为例,整合课标与研学资源,进行了高中地理研学旅行设计。  关键词:“从做中学”理论;学科核心素养;研学旅行设计  2016年11月,《关于推进中小学生研学旅行的意见》指出:研学旅行是面向全体中小学生,由学校有计划地组织安排,通过集体旅行、集中食宿方式开展的研究学习和
期刊
摘要:《人生》是中国当代作家路遥的成名作。小说以改革初期陕北高原的城乡生活为背景,讲述了出身农村的青年高加林有文化有理想,不甘做一个农民,渴望到大城市一展身手出人头地,却几经挫折最终回归乡土的悲剧故事。分析小说中人物的悲剧,首先交代各个人物所具有的人生的悲剧。其次探究其人生悲剧产生的原因。最后分析作者通过主人公高加林的悲剧想表达的思想意蕴,表现了对社会问题的反思。  关键词:路遥,命运,悲剧,《人
期刊