面向图像语义分割的神经网络架构优化

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yutianfeipao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展,图像语义分割已被广泛应用于无人驾驶、远程视频等场景。同时,图像数据集不断增大,所要构建的神经网络结构日趋复杂,这使得人工优化网络结构难以实现。如何自动优化面向图像语义分割任务的神经网络结构,已成为研究的难点。神经网络架构优化方向目前有两个侧重点:一是采用神经网络架构搜索的方式代替人工设计网络结构,二是通过模型压缩精简网络结构。主流的架构搜索方法无法搜索多尺度融合的网络结构,难以应用于图像语义信息有限的分割任务;同时,现有的模型压缩工作主要集中在图像分类任务,缺少在图像语义分割任务上的针对性研究。针对这些问题,本文重点研究了面向图像语义分割的神经网络架构优化方法,主要包括以下内容:1.提出了一种多尺度融合神经网络架构搜索方法。针对图像语义分割任务,构建了包含网络层和单元层的新型搜索空间以覆盖多种神经网络结构,设计了高效的搜索空间松弛方法以加快算法迭代,使得该方法在计算量约束下能够快速搜索多尺度融合的高效神经网络结构。2.提出了一种基于特征图分析的卷积神经网络剪枝方法。针对图像语义分割任务,从特征图可视化、权重数据和特征图数据三个方面分析,采用特征图稀疏性和相似性进行网络剪枝。与其他剪枝方法相比,该剪枝方法可以提高网络剪枝率,实现更有效的模型压缩。本文所提出的神经网络架构优化方案在Cityscapes、Chaos等数据集上进行了实验。结果表明,在相同计算量约束下,本优化方案所获得的神经网络比传统人工设计神经网络的效率更高,平均交并比(即mIOU)可以提升0.1%-5.3%。同时,本方案还可以针对硬件平台配置对算法进行优化以满足边缘端对于实时性的要求。譬如针对NVIDIA的Xavier板卡,本方案对于512 × 1024分辨率的图像输入,在保持精度的前提下,能够达到19.8FPS的帧率。
其他文献
哈里斯鹰算法作为一类新型群智能算法,受哈里斯鹰群狩猎行为启发而提出。哈里斯鹰算法具有原理简单、参数少、易实现、适合与其它算法结合、在高维问题上表现出色等优点,可用于求解各类寻优问题。也存在重点参数设置简单、低维问题上精度有限、过度依赖现有个体等问题。针对哈里斯鹰算法的不足,本文对哈里斯鹰算法进行了研究和改进,并应用于求解具有实际背景的优化问题。本文主要工作如下:(1)提出了一种改进哈里斯鹰算法(M
焊接作为制造业中一种重要的加工方法,在工业生产中得到了广泛应用。随着近年来制造业向着自动化、智能化的转型,对焊接过程的自动化、智能化需求也越来越高。现今的焊接机器人多以示教再现型机器人为主,对外部干扰的调节能力差,严重影响焊接质量。针对上述问题,本文基于双目立体视觉技术,重点研究T型焊接中焊缝检测技术,构建T型焊接自动化系统,具体工作内容如下:(1)介绍了双目立体视觉的基本原理,研究双目视觉的标定
火灾是最常见的灾害之一。一旦发生火灾,就会造成大量的人员伤亡以及重大的经济损失。因此,在火灾初期进行准确且快速的火灾识别具有重大的现实意义。随着计算机技术的不断发展,基于视频的火灾识别技术得到了广泛的关注。但目前基于视频的火灾识别方法仍存在误报率高等问题。针对以上情况,本文提出一种基于多传感器融合的火灾识别算法,并设计搭建了相应的系统平台对该方法的有效性与应用性进行了验证。本文首先分析了可见光与红
项目化学习是"三学三萌"科学微课程落地的主要形式,也是提升学生综合实践能力的重要路径。项目化学习是在情境中对问题展开探究,用项目小组的方式进行学习,运用各种工具和资源解决问题解决,最终产生公开交流表达的实践成果。在这过程中,用于引导学生项目化学习的驱动性问题至关重要,本文以《荷花池中的科学》项目为例作实施策略探讨。
随着现代流程工业技术不断发展,工业自动化系统逐渐趋向复杂化、信息化和智能化。新一代的信息技术将和传统制造业进行深度融合,把人员、机器、产品、数据连接起来,形成工业全生命周期的融合会聚。智能制造的升级能够加快我国工业制造业迈向高端、建设我国成为制造强国、在新的国际竞争中拔得头筹。而其中的数据整合分析与使用是实现智能制造的关键。随着传感器技术的发展,工业现场收集了大量数据。这些数据的来源不尽相同,数据
人机交互(Human Computer Interaction,HCI)是人工智能领域研究的热点方向,情绪识别是其中的重要研究内容。情绪识别是通过获取个体的生理或非生理信号对个体的情绪状态进行自动辨别,以实现更加友好和自然的人机交互。随着机器人产业和移动互联技术的高速发展,基于移动端设备的情绪识别研究不断深入,其中主要分为两个方向,一是在保证识别准确率的情况下对识别模型进行轻量化;二是基于信息融合
在高中阶段的学习过程中,物理是一门以实验为基础的学科,学生在进行实验的过程中可以提升自身的知识水平,利用实验的方式能够对物理知识进行深入的了解,同时在开展实验的过程中,教师可以对物理知识的原理进行讲解,从而让学生对知识产生更加深入的了解,并且在这一过程中还能够激发学生探索知识的兴趣,大大提高整个物理学习的效率。但是在现阶段高中物理实验开展方面,仍然存在着很多的问题,为了更好的运用物理实验来提高教学
数据采集传输系统广泛应用于水下资源勘探、海洋环境监测等领域。近年来数据采集传输系统的规模和复杂度不断增加,对数据采集传输节点的传输带宽、同步性能、外形尺寸等指标提出了更高的要求。而随着国际竞争的不断加剧,我国芯片进口受到了更多限制。为此,研发满足系统性能指标并实现系统国产化设计的数据采集传输节点具有迫切需求。本文研究开发了基于海思处理器的小型化数据采集传输节点。节点采用海思处理器和安路FPGA为核
四旋翼飞行器凭借其结构与控制算法简单,易于模块化,成本较低等优势在检测,巡检,航拍,安防等领域有着广泛的应用,但是其欠驱动特性影响了动态特性与抗扰性。因此本文设计双向电机驱动的四旋翼,应用对应的飞行控制算法与器件,提高四旋翼的位姿跟踪动态特性与抗扰性,并在仿真与实验中验证。本文的工作如下:首先,在直角笛卡尔坐标系系统中对双向电机驱动的四旋翼进行运动学与基于四元数的动力学建模,避免大角度机动时的奇点
随着现代信息技术的发展,工业过程信息采集、存储、传输变得更加普及,大量的工业过程数据可以刻画工业生成过程的场景,基于数据驱动的过程监测方法变得更为可行有效,也因此成为过程监测领域的研究热点。近几年,深度学习作为机器学习中的热门研究分支,已广泛应用于计算机视觉,自然语言处理,语音识别等领域,这体现出深度学习具有处理复杂数据的强大能力。因此,深度神经网络等有监督模型以其优越的性能被广泛应用到工业过程的