【摘 要】
:
行为识别作为计算机视觉的重要研究领域,在视频监控、视频摘要、视频搜索等诸多方面有着广泛的应用需求,然而视频数据比图像多了时间维度的信息,因此如何快速准确地在视频数据中提取有用信息为视频分析而言带来了巨大的挑战。本文借助深度学习技术和视觉注意力机制对视频中的人物行为进行识别:深度学习借助神经网络来让计算机对现实世界中的数据进行模式识别,不需要认为设计特征;视觉注意力主张人类在观察图像与视频时大脑会重
论文部分内容阅读
行为识别作为计算机视觉的重要研究领域,在视频监控、视频摘要、视频搜索等诸多方面有着广泛的应用需求,然而视频数据比图像多了时间维度的信息,因此如何快速准确地在视频数据中提取有用信息为视频分析而言带来了巨大的挑战。本文借助深度学习技术和视觉注意力机制对视频中的人物行为进行识别:深度学习借助神经网络来让计算机对现实世界中的数据进行模式识别,不需要认为设计特征;视觉注意力主张人类在观察图像与视频时大脑会重点关注某些区域,而不是均匀地将注意力分配在整副图像上,该机制适合分析视频这样动态变化的数据。本文不仅在技术上对深度神经网络进行了改进,还提出了一种新的视频行为识别模型框架。本文提出了通过卷积神经网络对视频帧提取多模态的特征,将视频数据转化为特征序列,之后通过LSTM递归神经网络对时序视频进行建模,同时将视觉注意力机制加入到LSTM递归神经网络中,使得模型在对视频数据进行建模的同时,赋予其对数据进行记忆-预测的功能,模型具有类似与人一样分配注意力的能力。本文提出的基于视觉注意力的模型在公开数据集ucf11和hmdb51上获得了89%和82%以上的准确率,远超传统的视频分析算法以及基础的深度神经网络,同时通过可视化的方法验证了视觉注意力模型对于深度神经网络的助益作用。
其他文献
本课题研究来源于全球范围内航空公司之间日益激烈的竞争,市场需要新的解决方案和工具来确保航空公司在市场中的地位及发展能力。解决该问题的两个有效的方法是:促进飞机的使用率以及减少飞机运营费用;这将使航空公司降低其运营成本,并在市场上建立较高的竞争地位。如今,航空业已成为世界上工业生产中最高科技的领域之一。航空业的关键词由其中的关键领域组成:飞机的设计、制造、修理、维护和运营等。对于每个单独的产品,MR
复杂轮廓曲线磨削广泛用于各种精密复杂模具、刀具等轮廓曲线类零件的精密加工,作为一种曲线类零件的精密加工方法,如何提高其加工精度已成为一个重要的研究课题,而误差补偿作为一种经济、有效的提高加工精度的方法,在研究中得到了广泛的应用。但是,目前已有的曲线磨削误差检测及补偿方法都存在着一些不足,如效率低下、补偿效果不好等。同时,随着计算机技术及图像处理技术的发展,计算机视觉被广泛应用在加工误差检测领域,具
发酵乳作为一种长寿食品一直备受关注。瑞士乳杆菌作为一种益生菌,其分解酪蛋白产生多肽Gln-Glu-Pro-Val-Leu(QEPVL)。QEPVL进一步经过胃肠道消化产生Gln-Glu-Pro-Val(QEPV)。前期研究表明,生物活性肽QEPV具有良好的免疫调节等功能。本文包含了多肽QEPV的生物活性和体内外检测等内容。第一、利用PERL语言解析瑞士乳杆菌的基因,发现瑞士乳杆菌有三个基因可以合成
影像测量技术测量复杂二维轮廓时具有非接触、效率高、分辨率高的优势,在生产过程产品质量检测领域得到广泛应用。影像测量作为视觉测量技术,不可避免存在测量场景与测量精度间的矛盾:即测量场景大,无法获得被测物高分辨率图像,影响测量精度;测量场景小,能保证测量精度,但无法获得较大被测对象的完整图像。本文针对这一矛盾,通过分区影像及图像拼接实现完整轮廓的影像测量,对于较大物体轮廓尺寸精密测量具有重要意义及实际
三哩岛事故的经验表明,严重事故下应急响应组织需要及时准确地判断反应堆堆芯状态,以进行可靠的应急决策行动。堆芯损伤评价方法能够有效的判断堆芯状态和裂变产物向环境释放,可降低事故后果,确保公众安全。因此,堆芯损伤评价方法对核电厂事故管理和应急响应具有重要意义。本文充分调研国内外压水堆堆芯损伤评价方法,分析了各类方法的共同点与差异。在此基础上,分析重水堆堆芯损伤评价方法的特点。针对严重事故下裂变产物的释
本研究根据中国共产党中央纪律检查委员会在习近平总书记领导下开展的反腐运动公开数据与国家工商总局的公开创业数据研究中国反腐运动对中国创业活动的影响关系。研究发现,中国反腐运动对地级市级别中不同企业类型的创业具有可区分的效应。为研究反腐审查运动对创业的因果效应,本研究采用基于反腐审查时段和反腐抓捕人数的加入交互项的模型,并加入行业、地级市和月度的固定效应。通过关注地级市级别的创业量变化,研究发现,高、
三维集成采用硅直通孔(Through-Silicon Via,TSV)实现堆叠式互连,满足高速低功耗的需求,成为延伸摩尔定律的突破性技术。然而,利用TSV纵向传输增加了系统的串扰噪声,影响了通信可靠性。本篇论文将基于上述问题提出两种抑制噪声算法,利用Ground TSV对信号TSV对进行隔离。提出改进的Liu算法,运用最优化算法优化TSV插入的位置和TSV数量。随后提出基于信号TSV重映射排布编码
人体足踝结构复杂,且各骨块之间的运动学和动力学信息难以从活体上测量,有限元数值分析方法和尸体足踝步态模拟亦难以获得令人满意的仿真结果,导致足踝疾病的病理研究以及临床治疗方案的优化研究处于瓶颈状态。因此,建立人体足踝多体运动学和动力学模型,通过步态仿真,验证模型的有效性并获得足踝各骨块之间的运动学和动力学数据,对于足踝与运动和受力有关的疾病发病机理探讨和治疗方案优化具有重要的理论意义和临床应用价值。
近年来钛合金在骨科植入物领域有着越来越广泛的应用,将钛合金多孔化能够减轻植入物重量,在满足抗压强度的情况下减小植入物弹性模量,同时形成的孔洞更有利于细胞生长。传统的钛合金多孔化方法存在很多弊端,随着金属3D打印技术的快速发展,如何利用3D打印技术制造规则的多孔钛合金骨科植入物,使其能够具备更好地力学性能和生物性能成为了目前的研究热点。本文首先利用UG10.0建模软件设计了多种规格,具有不同孔隙大小
超宽带(Ultra Wide Band,UWB)技术具有信号增益高、处理速度快、抗干扰性强等优势,能够对待测目标实现高精度的实时定位和成像,近年来在无线安全探测领域引起了广泛关注。随着无线安全探测的探测范围不断扩大、探测对象日益复杂、探测精度要求不断提高,UWB无线安全探测系统的测量精度、实时处理能力、环境适应性等性能需要进一步提升。针对上述问题,本文对现有方法进行了改进,增强了系统的环境适应性,