深度度量学习与条件随机场研究 ——以高光谱图像分类为例

来源 :天津大学 | 被引量 : 0次 | 上传用户:fdsth5x1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉中一个极其重要的研究领域是图像分类,它是人脸识别、图像检索等其他高级视觉任务的基础。近年来图像分类中一个比较火热的主题是高光谱图像分类。由于高光谱图像含有高的光谱分辨率,使得地物分辨识别能力被极大提高,因此它对农业、海洋、交通等多个方面起着重要的作用。传统机器学习方法在分类时依赖于人工设计的浅层特征,它们需要花费巨大的人力与时间,并且这些方法在面对高维数据时的表现不尽人意。而深度学习以其能自主学习抽象特征的表示极大地改善了传统分类方法的表现。而在此基础上的深度度量学习则为数据提供了一种相似性度量,使得生成的特征更具判别力,从而更有利于提升分类精度。另外,概率图模型的条件随机场在分类中也取得了不错的成绩,凭借着对上下文信息的充分利用,它取得了比一般只基于像素特征的分类方法更好的结果。为此本文主要研究了基于深度度量学习和条件随机场结合的分类算法,并研究了其在高光图像上的分类表现,具体内容为:1.给出一种深度度量学习模型用于特征提取。深度度量学习模型以神经网络为框架,在原有Softmax Loss的基础上通过再引入Center Loss,来联合监督训练网络。经训练后的网络就可从输入数据中提取到类内紧凑,类间分离的特征。结果表明该方法提取到的特征更具判别力。2.提出一种深度度量学习与条件随机场结合的分类方法。为了能进一步提高分类表现,在考虑到图像中含有丰富的上下文信息后,本文采用条件随机场作为后处理分类步骤。深度度量学习模型用于提取特征,条件随机场模型则是根据提取到的特征完成最终的分类。实验结果也说明在融合了上下文信息后,分类准确率能进一步提升。3.采用ConvCRF算法用于条件随机场模型的快速推断。条件随机场模型中所含的边数过多使得直接推断比较困难。为此,本文采用了基于平均场近似的ConvCRF算法来实现模型的推断。实验表明,与其他一些深度学习模型相比,本文方法具有更高的运算效率。
其他文献
随着自动驾驶、军事等领域对高速、高精度传感器需求的进一步提高,传统逐帧扫描图像传感器时间误差大、数据冗余等一系列缺点逐渐暴露出来。随后人们提出仿生图像传感器的概念,并且脉冲型仿生图像传感器与传统逐帧扫描图像传感器相比,具有冗余数据少、时间精度高和功耗低等优势,可应用于动态检测和高速目标追踪等领域。然而,随着传感器阵列增大和场景复杂度提升,脉冲型仿生图像传感器的输出时间误差和光强量化误差开始增大,并
随着CMOS图像传感器(CMOS Image Sensor,CIS)技术的不断发展,CIS如今已被广泛应用于各种成像领域。但典型的滚筒快门CIS在拍摄高速运动的物体时存在固有的图像失真问题,而这种问题在全局快门CIS中得到了很好的解决。因此,全局快门CIS在机器视觉、工业测量等领域具有极其重要的应用价值。但随着全局快门CIS中像素阵列的不断扩大,其设计复杂度也逐渐增加,从而导致了一系列非理想效应。
近年来,深度学习凭借其特有的优势,在计算机视觉等多个领域被广泛关注。本文概述了机器学习、深度学习及其相关算法,分析了经典的神经网络模型,并且详细介绍了常见特征提取算法和数据处理技术。本文建立了一种多源深度迁移学习分类模型MS-DTL,该模型在对深度学习算法创新的基础上,充分发挥了迁移学习的优势。为在源域中实现多任务学习的目标,模型MS-DTL采用多源训练策略,通过增加训练数据多样性,来提高预训练模
党的十八大以来,以习近平同志为核心的党中央高度重视教育工作。党中央、国务院不仅出台了一系列深化教育改革、推动教育发展的方针政策,习总书记也发表了一系列关于教育的重要论述,为新时期教育的发展指引了前进方向,提供了根本遵循。2014年5月30日,习总书记参加北京市海淀区民族小学庆祝"六一"国际儿童节活动时发表重要讲话,他要求:"学校要把德育放在更加重要的位置,全面加强校风、师德建设,
期刊
随着机器人技术的普及和发展,机器人的应用场景也在不断扩大。为了适应复杂多变的环境并能自主完成任务,机器人必须具备同步定位与地图构建(SLAM)能力。光束平差法(BA)是SLAM技术中最有效的一种解决方案,但是其庞大计算量带来的高延迟和高功耗的问题制约了其在嵌入式系统中的应用。为解决这一问题,本文在光束平差法的硬件设计上做了先行的探索。本文提出并实现了光束平差法的FPGA加速器。针对光束平差算法中计
风格迁移是计算机视觉中极具创造性的一个领域,随着深度学习重回大众视野,大量的神经网络结构被用于这一领域的探索。虽然优秀的相关算法不断面世,但是距离高效率的,有鲁棒性和泛化性的模型仍然有巨大的提升空间。一是在局部风格迁移过程中,如何平衡图像的语义内容信息和风格特征信息,高效率地获得迁移结果;二是如何在不同层级的特征空间整合有效信息,处理多域的风格迁移问题。针对这两点,本文基于神经网络提出两种改进的风
随着数据采集技术的发展,获取数据的方式越来越多样化,所得到数据通常具有多个视图,从而形成多视图数据。如何高效利用多视图数据所包含的信息进行学习是多视图学习的研究目标。为了更好地利用多视图数据,促进多视图学习在实际中的应用,必须要考虑多变量相关性。针对单视图数据的多变量相关性问题,本文基于单输入单输出的矩阵信息通道,提出了多变量输入的张量信息通道,该通道可以研究多变量如何共享信息,与矩阵信息通道相比
近年来,多智能体系统在许多领域都有广泛应用,比如无人飞行器的协同控制、编队控制和耦合振子同步等;多智能体系统的分布式协调控制已经吸引了越来越多的科研工作者的关注.目前关于多智能体系统分布式协调控制的研究,大多都是假设智能体之间是连续通信的,而对于间歇通信下多智能体系统的研究还相对较少.本文分别研究了间歇通信下一般线性多智能体系统的一致性和鲁棒镇定问题,主要内容和贡献如下:1.分别研究了间歇通信下连
以控制架构为主的中央处理器(Central Processing Unit,CPU)无法深层次优化卷积神经网络的计算,在速度和功耗方面难以满足应用的要求。而计算密集的现场可编程门阵列(Field Programmable Gate Array,FPGA)适合并行计算的开发,并且具有可配置、开发周期短、成本低等特点,所以成为了部署卷积神经网络的热门平台。但卷积神经网络模型庞大、计算复杂,且FPGA的
视觉里程计通过分析处理图像序列来感知周围场景的三维信息,并确定运动相机的位姿,在机器人定位导航、自动驾驶,虚拟现实、增强现实和三维重建等领域都发挥着基础性的作用。近年来,深度学习与卷积神经网络在图像识别与跟踪等计算机视觉领域取得巨大成功,这也使得研究人员开始将深度学习应用于视觉里程计的技术研究中。本文对基于无监督深度学习方法的视觉里程计进行研究,设计了一个能同时完成场景深度估计与相机位姿估计任务的