基于深度学习的人体动作识别方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:fang82888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别已经应用于多个领域,是计算机视觉科学中的一个热门研究方向。动作在空间和时间维度上具有多样性和复杂性,以及动作识别是一些其它领域的关键,因此对动作识别的研究仍然具有广阔的前景。深度学习技术与动作识别的结合使研究者可以设计出灵活多样的识别方法。基于深度学习和动作序列的骨骼数据,在本文中首先提出了一种增强的视图无关动作特征表示与组合时间注意力模型的动作识别方法。通过结合非髋关节的累积欧式距离增强了动作特征,突出了与动作关联更紧密的一部分关节,再使用一个组合时间注意力模型提取特征和分类动作。在两个基准多视图数据集上的实验结果表明,这种增强的视图无关动作特征表示相对骨骼数据能提升识别精度和更好的鲁棒性,整个方法能取得良好的识别精度。为进一步提升鲁棒性和减少动作的混淆性,在保留组合时间注意力模型架构的基础上,提出了一种基于帧插值和组合自注意力模型的动作识别方法。帧插值操作扩展了动作序列在时间维度上的信息,提升了鲁棒性和识别精度。组合自注意力模型充分利用了迁移CNN在图像识别和减轻过拟合方面的优势,自注意力机制自动地关注聚焦于显著可区分信息,相对前一种方法,该模型能够提升识别性能。在本文中还对实时动作识别方面进行了探索,提出了一种基于关键帧选取的实时动作识别方法,虽然在识别精度上不够理想,但在减少帧输入数据量方面显著有效,并在引入的实时评价指标上远超过前两种方法,这在将来的工作中具有可改进的价值。
其他文献
随着车联网(Internet of Vehicles,Io V)技术的普及,车辆的数量和车辆产生的数据量日益增加,由于车辆自身的计算资源和电池容量存在上限,在车辆本地执行任务无法满足低时延和
森林分布极为广泛并且地形复杂多样,以传统方法对森林结构参数进行调查,需要耗费大量的人力、物力和财力。无人机和计算机视觉技术的快速发展,使得快捷、较低成本、较高精度
在大数据牵引的信息时代,随着军事信息获取和分析手段的多样化和精细化,虽然为作战人员带来了磅礴的信息资源,但也造成了严重的信息负担。如何快速准确的从海量信息中抽取出
本英汉翻译项目包括两部分。第一部分是翻译研究报告,第二部分是选文及其译文。翻译项目的原文选自哥伦比亚州立大学哥伦布分校语言和文学系的助理教授诺琳·格鲁弗·莱普所著的《边界以西:美国西部边疆多元文化文学》一书中的第三章“美国边疆华裔中存在的新娘买卖和被迫单身现象”。本章讲述了早期中国移民引发美国恐慌,美国利用移民法和多种手段来抑制中国人口的增加,其中包括买卖新娘、禁止组建家庭、限制入境等。根据皮特·
近年来,随着互联网的普及和社交网站的发展,新浪微博作为一种主流的媒体形式和交流平台受到广泛关注,在用户量增长的同时,一大批机器用户也随之涌现,它们耗费系统资源、影响平台效率、混淆网民视听,尤其是其中的恶性用户大量发布虚假信息、散布谣言、误导网民舆论,严重污染网络环境,危害网民利益。本文以新浪微博用户为研究对象,旨在探索识别微博一类典型虚假用户——机器用户的有效方法。本文数据来源为新浪微博数据仓库,
随着移动通信技术的飞速发展,移动终端设备也随之剧增,导致通信系统能源损耗问题日益凸显。尤其是随着第五代移动通信技术的发展,大规模多输入多输出(MIMO)系统将成为下一代
气动测量具有非线性、高灵敏度、高精度且不受工件材料和形状等因素的影响,因而在工业生产中得到普遍应用和不断发展。但是传统的背压式气动量仪精度高(可以达到1μm以内),量
大规模在线开放课程(Massive Open Online Courses,MOOC)的论坛是教师理解和干预学习者学习活动的重要工具,论坛中存在着大量学习者的学习过程和体验数据。由于教师和管理人
工业机器人已广泛的应用于工业生产过程中,为此如何进一步的提高工业机器人的工作质量已成为我们不懈的研究方向。机器人是一个复杂的、多输入多输出的、非线性的多耦合系统
立体匹配是一种根据平面图像来恢复真实场景深度信息的技术,其做法是从两个或多个相同场景的图像中找出匹配点对,然后根据三角测量原理计算点对所对应的空间物理点的深度。立