基于信道信息状态和元学习的动作识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:cm__
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于信道状态信息(CSI)的动作识别近年来发展迅速,与基于图像,穿戴设备等方式的动作识别相比它具有保护隐私,无需光照,方便等优点。但是目前大多数CSI动作识别系统在新环境中使用或识别新类型的动作时,都需要重新收集大量样本并重新训练模型,这大大降低了CSI动作识别的实用性。为了解决这个问题,本文设计了一种基于元学习的CSI动作识别系统,当将其用于新环境或识别新类型的动作时,它只需很少的数据对模型进行微调即可完成识别。本文的主要工作如下:1.使用元学习算法来获得适应任务分布的预训练模型,当环境或动作类别发生变化时,系统不需要重新训练模型,而是通过一个或多个梯度步骤对预训练模型进行更新,这个过程只使用少量新动作的样本。2.为了防止使用多层CNN进行特征提取后CSI时间信息的丢失,先在CSI数据上添加时间编码然后作为CNN神经网络的输入;为提高识别精度,在神经网络中加入了注意力层以使模型更加关注于数据中对应动作的部分。3.考虑到CSI数据在标记过程中可能未被正确标记,系统采用改进后的平均分类交叉熵损失函数(MCCE),以增强对这些错误标记数据的鲁棒性。最后我们在手势数据集和身体动作数据集上测试了系统性能。手势识别时系统在每类1个样本的情况下达到了65.7%的平均准确度,在每类5个样本的情况下达到了84.4%的平均准确度。对于身体动作识别,系统在每类1个样本时平均准确度为74.5%,在每类5个样本时平均准确度为96.3%。
其他文献
随着互联网与智能移动设备的普及,各类应用平台的层出不穷引发了数据规模的爆炸式增长,在海量的产品中实现精准投放成为互联网平台获益的关键。提前对用户下一次的点击行为进行预测就显得尤为重要,点击率预测任务因其可用于评估用户点击产品的可能性的特点,目前已广泛部署在许多在线推荐和广告平台中。针对点击率数据特征学习的模型可分为两类:以学习线性特征组合进行预测的浅层模型(例如,梯度提升树),以及通过对复杂的稀疏
近年来,随着社会流动性增加,智能安防逐渐引起国内外科研学者的重视,而跨模态行人再识别系统是智能安防领域的重要研究课题,国内外科研人员都开展了相关研究,本文在现有成果的基础上进行了优化与改进,旨在深入解决跨模态行人再识别系统的难点与挑战。基于深度学习的跨模态行人再识别系统由两个重要分支组成,分别是行人检测网络和跨模态行人再识别网络,因此,本文的研究课题主要为行人检测和跨模态行人再识别两个方面。本文的
高光谱图像分类是高光谱图像分析中的一个重要研究领域。在考虑高光谱图像的光谱信息和空间信息的基础上,许多优秀的算法被提出应用于分类之中。遥感高光谱图像中大量的混合像元使可分性减弱。当前的高光谱分类都是单标签分类,从标签的角度看,用单标签来标记混合像元内的多种地物是不合适的。从分类的角度看,混合会让光谱特征空间的类内差异变大,类间差异变小,导致最终的分类结果变差。针对混合像元的存在,本文将多标签学习的
作为图像理解和计算机视觉任务中的热门课题之一,目标检测已经成为解决行人检测、人脸识别、路径跟踪等复杂任务的基础。其主要目的是确定自然图像中是否存在预定义的物体实例,并返回物体实例的空间位置和类别。随着深度学习技术的普及,基于深度学习的目标检测框架相较于传统方法获得了更好的检测性能。由于不断出现的复杂任务场景,现阶段对于检测器的实时性的要求也越来越高。单阶段目标检测器以其较少的参数和较高的推理速度,
行人再识别的目的是在智能视频监控系统非重叠摄像机视角下对同一行人进行识别匹配。该技术在实际生活中的很多领域有着越来越多的应用,包括公共安全、行为分析和交通流分析等。受光照变化、背景复杂、行人姿态变化和行人被遮挡的影响,行人再识别技术面临着巨大的挑战,成为计算机视觉领域的研究热点和难点。为了能更好地解决这些问题,本文引入了多种注意力机制,重点对于视频行人再识别技术进行了深入研究,有效地提升视频行人再
随着人工智能的兴起,深度学习发展迅速。然而传统深度学习在实现时需要大量的标注样本进行深度模型的训练,成本高昂。因此,如何让深度模型减少对训练样本数量的依赖,即实现小样本学习成为了研究的关键。基于度量学习的小样本学习方法简单高效,其主要通过将样本映射到特征空间中再进行距离度量实现。本文基于度量学习方法,首先通过多尺度特征提取网络和图神经网络提高基础方法挖掘样本特征信息的能力,再优化传统类表达特征计算
人体姿态估计的目标是定位图片中所有人的关节点,它可以应用到人体行为识别、虚拟现实等领域。近年来,基于卷积神经网络的人体姿态估计方法虽然已经取得极大进展,但仍存在一些问题:(1)不精确的监督信息导致模型退化。(2)在多尺度特征融合过程中,不同尺度特征之间的关系被忽视了。(3)由于参数量多,计算量大,这些模型无法在资源受限的设备上使用。为此,本文结合精确监督、注意力机制和知识蒸馏,来研究人体姿态估计的
随着无人机和计算机视觉的快速发展,基于无人机的智能目标跟踪系统在交通监控、军事反恐侦察和森林防护等很多领域均有广泛应用。航拍视频中的目标跟踪有以下特点:1)目标仅由几个像素组成,其大小与噪声非常相似;2)安装有摄像机的无人机设备的运动是任意的、不受约束的;3)感兴趣目标相对于摄像机的运动是独立的,因此有时物体可以在任意点离开或进入摄像机的视场;4)物体的外观和形状因光照和姿态的变化而变化;5)相机
高光谱遥感图像分类是遥感图像自动理解的一项基本任务,也是深度挖掘遥感信息的前提保障,在自然灾害检测、地理图像检索、环境监测等领域有着广泛的应用。随着遥感卫星技术的日新月异,获得遥感图像分辨率愈来愈高,也正因为遥感图像分辨率不断提高,可以从图像中提取更多有用的信息。然而,由于高光谱遥感图像的分辨率不断提高,其图片复杂的空间结构和信息冗余都为场景分类任务带来新的挑战:不同场景类别之间不仅存在一些相同的
社会关系作为我们日常生活中的基本关系,是人类社会特有的现象,随着各类社会媒体的发展,社会关系有了更加直观的表现形式,识别图像视频数据中的社会关系,对分析社会行为来说至关重要。然而,面对如此海量的图像视频数据,如何高效地对复杂场景中的特征和交互信息进行形象化的描述,进而准确地识别社会关系,仍然是一个具有重大挑战性的任务。现有的社会关系识别方法虽然能够识别出场景中的社会关系,但是仍然存在一定的局限性。