【摘 要】
:
图像分割是计算机视觉与图像处理应用的关键基础,其研究目标是根据图像内在特征建立像素级标签,将其划分为不同的语义区域。随着深度学习技术的兴起,基于卷积神经网络的图像分割技术取得了阶段性突破。然而,现有方法主要基于图像局部特征到像素级标签的非线性映射,其成功依赖于成像清晰、规模庞大的高质量训练数据集,在众多实际应用中均难以获取。一方面,恶劣天气(如雨、雾)环境下采集的图像数据规模大,但能见度低,为精准
论文部分内容阅读
图像分割是计算机视觉与图像处理应用的关键基础,其研究目标是根据图像内在特征建立像素级标签,将其划分为不同的语义区域。随着深度学习技术的兴起,基于卷积神经网络的图像分割技术取得了阶段性突破。然而,现有方法主要基于图像局部特征到像素级标签的非线性映射,其成功依赖于成像清晰、规模庞大的高质量训练数据集,在众多实际应用中均难以获取。一方面,恶劣天气(如雨、雾)环境下采集的图像数据规模大,但能见度低,为精准的图像描述带来巨大挑战;另一方面,在专业背景强的应用领域(如医疗、军事目标图像分析),图像采集和标注存在困难,成像清晰但规模小,显著增加模型训练的过拟合风险。针对高质量训练集供给不足带来的挑战,本文从关系建模的角度出发,建立非局部的图像特征描述,增强模型的上下文关系捕获能力,从而提升图像分割算法的鲁棒性与泛化能力。具体包括如下三个方面:空域上下文关系建模、语义无关特征域上下文关系建模,以及语义相关特征域上下文关系建模。(1)针对有雾图像分割,从提升成像清晰度的角度出发,提出一种基于空域上下文关系的图像去雾方法,设计区域自适应两阶段网络来建模有雾图像在像素空间的上下文关系,采用两阶段策略和区域自适应融合策略,使得模型能够满足不同空间位置区域对图像亮度调整和细节修复的自适应需求,极大提高了有雾图像的恢复质量,进而提升其分割精度。(2)针对有雾图像分割,从提升机器感知的角度出发,提出一种基于语义无关特征域上下文关系的有雾特征增强方法,设计深度特征精细化模块来建模有雾图像在特征空间的上下文关系,使得模型能够有效捕捉不同特征点的远近距离依赖关系,避免了去雾图像中语义无关的伪影对分割性能的影响,降低了模型的复杂度和推理时间,并提高了分割精度和泛化性能。(3)针对小样本图像分割,提出一种基于语义相关特征域上下文关系的小样本图像分割方法,该方案基于原型学习思想来设计级联关系原型网络,通过融入支持集图像像素级标注的语义信息,建模支持集图像和查询集图像在特征空间的上下文关系,充分挖掘两者的共现特征,使得模型能够快速地适应新的类别,进而提升小样本图像分割的精度。
其他文献
射频识别(Radio Frequency Identification,RFID)是一种使用电磁信号进行非接触双向无线通信的技术。随着通信技术的不断发展,无线技术在人们的生活中被越来越广泛的使用,RFID技术在无线通信领域的地位也越来越高。目前工作在13.56MHz和900MHz的电子标签已经发展的较为成熟,工作在2.45GHz的RFID系统不能广泛应用的主要原因是其使用的电子标签价格过高不能批量
特发性肺纤维化(idiopathic pulmonary fibrosis,IPF)作为间质性肺部疾病(interstitial lung diseases,ILDs)的一种表现,具有初期隐匿性,中后期致死率高的特点。遗憾的是,目前IPF并无有效的治疗方案,因此早检查、早诊断、早治疗可以有效提高IPF患者的生存率。但是,人工诊断方式需要繁琐的步骤和丰富的临床经验,这要求医生具有丰沛的精力和优秀的专
在实际应用中,因为测试任务的复杂,测试领域对多功能模块化仪器的需求越来越大。目前国外对多功能模块化仪器的研究较为成熟,仪器功能丰富但价格昂贵,国内并未推出多功能模块化仪器。为打破进口垄断,实现国产化,在国内开展对多功能模块化仪器及其配套软件的研究十分必要。本文的研究目标是基于某型VXI总线多功能模拟信号测试模块进行软件设计。该模块集成了数字化仪、任意波发生器和频率计的测量功能,可应用于多功能联合测
当前主流的人体安检设备大多为金属探测门,但其仅能对人身携带的金属物品进行检测,而对其他非金属材质的物品检测能力不足。太赫兹无源成像技术采用无源的工作方式,被动地接收人体和隐蔽目标自身辐射的太赫兹频段电磁波来进行成像,对人体无辐射性危害。并且太赫兹频段电磁波对衣物等具有高穿透性,可以探检到隐藏在人体衣物内的各类危险物品,该技术在公共场所的人体安检设备中具有重要的应用前景和研究价值。本论文的研究依托于
随着人口老龄化的加剧,人们对老年人的健康监测技术提出了更高的要求。室内人体速度估计是老年人居家健康监测的关键,它可以提供人体的运动状态。现阶段,一些穿戴式设备或光学设备等都提供了高准确度的速度估计方法,但接触式设备的要求是繁琐的,而光学设备也存在只能视距监测、侵犯隐私等问题。因此,人们迫切需要一种非接触性和非视距性的速度监测方法。随着技术的发展,基于射频信号的无线感知技术得到了广泛关注。但是,由于
目前,随着互联网技术的快速发展及工业4.0的提出,未来的社会生活将会发生巨大的变化。目前5G技术的发展以及6G技术的提出让万物互联不仅仅只是期望而有望成为事实,而要实现万物互联,其中的一个关键技术突破点就在于人机交互新型传感器的开发。例如智能家居系统中如何感知人体的温度及人体的位置从而实现家居系统的智能调控,无人看护的老人如何感知判断自身的身体状况指标并上传到监控系统,仿生型机器人如何具有类似于人
图像语义分割旨在实现图像像素级区域分割与识别,是多媒体分析、计算机视觉等众多任务的基础步骤。由于存在类内的差异性、类间的相似性、以及背景的复杂性等干扰问题,图像语义分割是一个极具挑战的工作。传统分割方法立足于手工设计的低层特征,难以有效刻画对象的语义信息,导致分割性能不足。近期,基于深度学习的分割方法能够通过深度网络提取更具判别性的深度语义特征,有效改善了语义分割性能。然而,基于深度学习的图像分割
人体行为识别是机器人系统及计算机视觉领域的基本研究挑战之一,其研究内容是识别视频中的人体行为,对视频进行分类。基于视觉的人体行为识别技术有着重要的现实意义,在智能监控,自动驾驶,视频剪辑,基于互联网视频的内容检索与分类,以及人机交互,游戏娱乐等领域有着重要的应用价值。传统算法往往识别精度较低,实现复杂,且大多依赖手工特征,模型的普适性较差;深度学习的出现与普及在很大程度上解决了传统算法中存在的一系
金属3D打印应用广泛,在现代制造技术中具有举足轻重的地位。在使用SLM技术打印过程中,零件内部会形成较大的温度梯度,同时受到周围材料的约束在金属结构件中产生较大的热应力,如果当残余应力积累到材料强度无法抵抗时会产生裂纹来释放应力。裂纹缺陷严重影响到零件的力学性能、减少零件的疲劳寿命,因此实现裂纹缺陷的检测定位是具有重要意义的。声发射技术作为一种新型的动态无损检测技术,越来越多的被应用于复杂的工业检
随着电力电子、机电一体化等领域的快速发展,电子测试技术已经越来越广泛地应用于各类工业生产和科研工作中。但是传统的测量仪器面对现代社会越来越高的测量需求,已经难以应对。因此开发出一款能够实现多通道、多物理量测量并且具有程控功能的示波记录仪尤为重要。本文研制的示波记录仪是一款基于采集板卡+信号处理板+工控机架构的多功能电子测量仪器,本文的研究目标是为其设计实现底层软件及程控功能,底层软件包括可供应用层