基于深度学习的PolSAR分类和视频行为识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:luannj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着遥感技术的进步以及移动终端的普及,图片和视频数据规模也呈现爆发式增长。极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,Pol SAR)图片自动解译以及视频实时行为识别也吸引越来越多学术界和工业界的关注。随着深度卷积神经网络(Convolution Neural Network,CNN)在图片分类等赛道上的逐次突破,深度学习算法被引入到Pol SAR图像和视频理解任务中。由于Pol SAR图像和视频数据不同于一般的光学图像,直接将CNN模型应用到该数据上往往无法取得理想的结果。因此,本文针对Pol SAR图像分类和视频行为识别中存在的问题,设计了三种神经网络模型,并使用不同任务上公开数据集验证了算法性能。关键内容总结如下:1)提出了一种复数卷积自编码器(CV-CAE)与空间像素块修正(SPF)算法,CV-CAE输入样本为从原始图中切分的图像块,传统的逐像素移动切分较为耗时,因此,本模型中使用构造切分矩阵的方法快速切分训练和测试样本。CV-CAE能够直接使用Pol SAR协方差矩阵中的复数值作为模型输入,且利用重构损失从无标签输入样本中提取特征。该模型在不破坏Pol SAR复数特性的同时减少对标注数据的依赖。SPF算法利用Pol SAR块状地物结构,通过先投票后差值运算一次修正CV-CAE初分类结果中每个像素块的所有像素类别。相比较同类任务中的其他算法,CV-CAE能够使用较少标注数据获得较高的分类正确率。2)提出一种运动向量增强模型(GMV-Net),GMV-Net用于缓解压缩视频中运动向量(MV)分辨率低且受噪声影响,无法提取丰富的时序判别特征的问题。该模型使用光流作为监督信息对从压缩视频中直接提取的含有运动信息的运动向量(MV)增强,数据预处理时间较短。其次,GMV-Net生成模型为有跳跃连接的编解码结构,能够利用模型各层特征对输入样本重构,并实现对输入数据增强。同时,该模型基于深度可分离卷积结构,其网络层数和特征通道数均少于同类其他模型,模型参数量大大减少,有助于模型更快收敛。同时模型也具有较强实时性。实验验证GMV-Net具有较高的实时性和有效性。3)提出一种长时时序特征提取模型(LTS),LTS模型中位置编码为经过特征提取的压缩视频残差帧(R帧)向量,由于R帧为压缩视频中当前帧和预测的差值,包含了每帧数据大部分的边缘信息,因此能够唯一标识该帧数据。为了能够获取长时时序特征,LTS模型使用经过特征提取的增强运动向量(EMV)作为输入样本。其次,LTS模型使用基于多头自注意力机制的特征提取块,能够获取当前帧和视频段中其他帧之间的关联性,有利于更好的确定时序关系,同时减少冗余信息的影响。实验证明该算法在取得较高识别正确率的同时能够达到对视频实时处理。
其他文献
扫描近场光学显微术(Scanning Near-field Optical Microscopy,SNOM)是一种基于扫描探针的光学显微技术,其核心思想是用一个亚波长直径尖端的探针,将光近场的高空间频率分量转换为可探测的远场信号,从而实现超分辨的光学成像。探针是近场光学技术中一个核心部件,探针的性能在很大程度上会决定整个系统的成像能力,纳米发光体探针是近场光学探针中的一个重要分支。纳米发光体是指如
在互联网的发展潮流中,音乐无疑扮演着一个非常重要的角色。各大音乐平台为消费者提供了无数的音乐作品,让人们可以每时每刻沉浸在音乐的海洋中。但是,随着互联网资源的日趋丰富,海量的数据常常让用户难以找到自己真正需求的音乐。一个优秀的音乐推荐系统可以很好的解决这个问题,在给用户推荐适合歌曲的同时,还能够为平台方吸引用户,增加商业利益。推荐技术日趋成熟,主流的推荐技术包括协同过滤推荐技术和基于内容的推荐技术
随着中国提出“中国制造2025”的战略方向,传统流水线上的机器人作业容错率低,难以满足复杂环境下的柔性生产的背景下,机器人难以应对复杂环境及相互遮挡的条件下的目标物体识别和位姿估计,对目前的三维物体检测识别和位姿估计算法有一定的挑战。本文以Kinect相机采集的彩色图像和深度图像作为信息源,研究复杂环境下立体目标检测和位姿估计算法,并用机械臂实现对目标物体的抓取。本文工作主要包括以下几个方面:(1
过共晶铝硅合金具有高耐磨、耐热、低线收缩率和密度等综合性而被广泛应用于汽车、船舶、军工等领域,但是由于含硅量高、强度低及脆性大,传统工艺常常无法满足各领域对其性能的需求,制约了过共晶铝合金的发展应用。脉冲磁致振荡及超声波处理被视为近年来改善材料组织,提高力学性能的有效技术。因此,本文将以Al-25%Si合金为研究对象,通过向Al-25%Si合金熔体施加脉冲磁致振荡技术及超声处理,研究脉冲磁致振荡频
泥石流灾害是北京地区造成人员伤亡最大的地质灾害,新中国成立以来北京地区泥石流共造成了500多人死亡,直接损失高达数亿元。北京市山区2012年7月21日强降雨诱发泥石流造成了重大人员伤亡和财产损失,该地区40多条山谷暴发泥石流。针对北京山区泥石流预警研究,可为受威胁目标提供有针对性的预测预警信息。因此区域性的泥石流预测预警研究具有很大的学术意义和实用价值。本文主要以北京“7.21”泥石流灾害为例,收
鉴于目前对于手机外壳外形尺寸三维测量系统存在价格昂贵、效率低、精度低等问题,本文立足于解决生产线检测过程中对于手机外壳外形尺寸检测的难题,设计了一种基于结构光视觉的手机外壳三维测量系统,该测量系统由一台投影仪和一台摄像机以及计算机等组成,通过投影仪将光栅条纹投影至手机外壳表面,利用摄像机接收经过手机外壳调制产生变形的光栅条纹,变形的光栅条纹携带了手机外壳的相位信息,结合标定、相位计算、三维重构等技
中国是受台风灾害影响最大的国家之一,台风风暴潮过程中的风浪严重危害沿海的区域,风暴潮模型的数值模拟能够直观地对风暴潮进行研究,且应用范围广泛,通过对台风风暴潮的模拟,能够帮助对潮位和淹没区域进行预测,对于灾害的预警和治理具有重要意义。而风暴潮模型数值模拟结果受输入的驱动台风风场的影响较大,因此对台风风场的优化是提高风暴潮模拟精度的关键。目前,半经验半理论风场模型的使用较广泛,但其仅仅可以近似地模拟
自动化测试的应用越来越广泛,其中基于启发式搜索算法的测试数据自动生成方法由于其覆盖能力强、生成速度快,而广受关注。路径覆盖已被证实是发现错误能力最强的覆盖标准,所以本文从路径入手,先用基于关键点路径的测试数据自动生成模型进行路径预处理,筛掉易覆盖和不可行路径,剩下的难覆盖路径用全局性极强的蚁群算法进行覆盖。本文先就关键点模型中的不可行检测方法提出改进,然后对蚁群算法提出改进,最后把它们结合为一个完
差分进化算法是一种基于进化思想和种群差异的群智能优化算法,原理简单,控制参数较少,全局收敛速度快。差分进化算法中参数的设置策略及差分进化算法与其他群智能优化算法的结合是差分进化算法的重要研究内容。本文在前人研究工作的基础上,对差分进化算法中自适应调整参数的方法及高维多目标差分进化算法进行了一些研究,其主要内容如下:1.根据差分进化算法的研究历程和研究近况对其基础理论研究和应用研究进行了介绍;对差分
穿墙雷达(Through-the-Wall Radar,TWR)可以实现对障碍物后一定范围内物体进行探测、识别、定位以及追踪。在实际的TWR环境中,由于电磁波在穿过墙体时发生信号衰减,导致目标成像模糊且偏离真实位置。如果准确知道墙体的结构参数,例如厚度,相对介电常数和电导率,则可以补偿墙体内部电磁波传播效应。因此未知墙体参数的估计对穿墙雷达的应用具有重要的意义。本文基于墙体回波频域信号模型和时域信