基于卷积神经网络的实时语义分割方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:xryanqd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割(Image Semantic Segmentation)是目前计算机视觉领域内格外热门的研究方向,其目的是将输入图像划分为若干组具有一定语义意义的像素区域,并自动标注出每个区域的类别,最终输出带有语义标注的图像。卷积神经网络(Convolutional Neural Network,CNN)的提出,把图像语义分割任务的要求提升到了一个新的高度。而传统的卷积神经网络虽然已经极大地提高了分割的精度,但是抛开精度,CNN网络首要考虑的指标应当是模型的计算复杂度。由于复杂度过高的网络运行速度会很低下,某些需要满足低延时要求的实时应用场景比如自动驾驶场景,对于模型运行效率就有着极为严格的要求,另外又快又好的轻量级模型也是移动端设备部署的优选。当前对于模型实践及落地的要求都比较严格,图像语义分割如何取得高精度跟高效率之间的平衡就显得尤为重要,因此,在实时语义分割任务中兼顾模型的精度与速度具有重大的研究意义,本文针对这一任务展开研究,具体研究内容如下:第一,设计一种用于实时语义分割的轻量级卷积神经网络。相对于近年来轻量级网络更倾向于采用浅层结构的发展,该网络致力于设计更深层的网络结构以获取更好的特征表达,同时还能保持较快的推理速度和较高的分割精度。新的极致高效残差模块采用深度可分离扩张卷积来学习不同尺度感受野的特征表示,除此以外还增加多个跳跃连接分支,用于从中间卷积层收集上下文信息。模型尺寸仅为0.8M,在输入图像分辨率为1024×512的情况下,实现了60FPS的运行速度,在城市景观数据集上的测试速度和精度平衡方面达到了最佳。第二,设计一种基于注意力引导机制的实时语义分割网络。以编解码结构为网络主干,以极致高效残差模块特征提取单元,使用新提出的自适应注意力模块来捕捉到每个像素点之间的相关性信息,并通过自适应融合模块将低级与高级特征连接起来,以此提高网络的特征表达能力。实验表明,该网络的模型尺寸仅为0.81M,在城市景观数据集上精度达到了72.4%,实现了60FPS的运行速度,超过移动设备实时标准。第三,设计一种基于并行分支的轻量级语义分割网络。设计了具有丰富语义信息的较深的范畴语义分支和具有丰富细节信息的较浅的空间细节分支,以及全局注意力模块来建立整体网络之间的联系。在两个一深一浅的分支基础上,再次引入全局注意力模块,用范畴语义分支的信息去指导空间细节分支进一步定位细节,实现速度和精度的平衡。实验表明,该网络在城市景观数据集上精度达到了73.3%,运行速度达到54FPS,可以应用到更加复杂的实时场景理解任务中。
其他文献
云南高原产区是我国九大葡萄酒产区之一,具有得天独厚的地理优势以及蕴含民族特色的葡萄酒文化,其中弥勒产区葡萄种植历史最久,规模也最大,在政府部门高度重视的推动下,形成了种植业、加工业、旅游业三产融合的良性发展模式。葡萄酒文化是人们对葡萄加工过程中共同创造出的具有重要价值的文化瑰宝,在文化产业迅猛发展及消费者对精神需求不断扩大的背景下,传播具有产地特色的葡萄酒文化具有必要性与重要意义。当前,云南高原产
道具是电影创作中十分重要的元素,它对故事情节的发展、人物关系的改变,电影主题的深化都有着不可忽视的作用。不管是影视作品,文学还是戏剧,道具都是创作者尤其关注的表现手段之一。笔者将通过赏析一些妙用道具的经典艺术作品,并结合自己的实践创作《剃头》进行总结分析,从“剃刀”对人物关系的改变、内心世界的折射,和呈现的多层意义为着手点,重点探讨贯穿道具在影视中的作用。在笔者创作的电影剧本《剃头》中,“剃刀”无
在现代戏剧的创作中,越来越关注人复杂的内心世界,所以根据心理时空结构的表现手法,往往成为现代戏剧的艺术特征之一。心理空间超越了外在的表层遮蔽,揭露了来自人心灵深处的真实,是对人的本质的深层刻写。在本人毕业作品小剧场话剧《如果有来生》的创作过程中,由于选择了主人公自杀后,生命弥留之际的心理视角,故推动了整个戏的叙事方式。心理时空的构建,在此剧本中带来了多线叙事并用、时空转换的叙事手法,以及叙事的风格
话剧是语言与行动的艺术,语言的灵魂在于节奏,在戏剧领域被称为语言节奏。在话剧表演当中,台词作为话剧的重要输出途径最为直观的将角色内心情感传递给观众,但是演员要在有限的时空条件中仅通过台词来树立鲜明立体的人物形象,语言节奏的把控则是最不可或缺的一项。规定情境是一部话剧的潜在法律,决定着事件、人物、情节发展的走向,语言节奏作为话剧台词的重要表现形式受到规定情境的影响,被规定情境所制约,相反又对规定情境
传统民居,作为社会结构内的一个重要群体,逐步被人类学、建筑学、美学等众多领域的研究人员所关注。而江西传统民居历史文化悠久,但因其地处相对较远,交通不便,经济发展不平衡等相关因素影响,使得该地区的传统民居保留了鲜明的地域文化特征及固有文化特征,且在一个相对于稳定的时间内,可以良好的体现出一个区域的原真性及相应的生活状态,可为相关研究人员解释资料和得出结论提供标准。本文选取江西省吉安市燕坊古村作为研究
光纤传感以非破坏性、不受电磁干扰等优势在生物传感领域的应用越来越广泛。在光纤传感技术中,光子晶体光纤(Photonic Crystal Fiber,PCF)等微结构光纤因其灵活多变的结构、新颖的传输特性、多参数测量等优势受到越来越多的关注。DNA作为染色体的主要成分,其检测在基因和蛋白质组学、临床诊断和化学检测等方面具有重要作用,已成为生命科学领域的一个重要课题。因此本文在PCF结构中通过引入不同
学位
表演艺术的终极目的是在舞台上塑造鲜明的人物形象,然而塑造鲜明人物形象的基础和手段就是组织行动。创造出人物行动的有机过程,是演员在掌握创作方法时应该注意的重要问题。正如斯坦尼斯拉夫斯基所说“演员是舞台动作的大师”,演员的任务就是再现人的行动来创造人物形象。论文以毕业大戏《现代城》中刘剑这个角色的创作过程为例,详细论述了形体动作在人物创作过程中对舞台事件发展、人物性格化体现以及人物内心情感变化等方面的
本文主要分为古滇漆艺概述、古滇漆艺价值、古滇漆艺对当代漆艺创作的影响及启示、笔者创作这四个部分。云南有着悠久的用漆历史,最早可追溯到春秋末期。近些年,云南地区发掘出很多古滇国时期的古墓,出土了大量古滇国时期的漆器;特别是羊甫头墓地,出土的漆器是滇文化墓葬中种类最繁,数量最多的,这对于研究古滇时期的漆器的造型、工艺、纹样、色彩、造物理念等都具有重大意义。本文首先是从古滇历史、古滇漆艺分布范围、主要类
近年来玉雕创作受到西方文化的强烈冲击引发了设计思维的变革,表现出创作方式多元化的特征与此同时审美也在不断转变。田野调研中发现玉雕创作中存多组矛盾关系:一、悠久的历史与传承模式形成的思维惯性与融合发展的矛盾关系;二、受到经济利益驱动所形成的造型同质化的异化现象与以人为本的发展诉求的矛盾关系。本文从个案微观的研究视角出发,使用文献研究法和田野调研法分析总结亨利·摩尔的艺术语言造型规律,追溯其与玉雕艺术