视频动作识别中的时空特征学习

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:newhing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频动作识别是计算机视觉研究中的热门领域,其目标是识别一段视频中人物的动作。传统的图像识别中,图像的空间信息,包括纹理特征、形状特征及上下文关系等是算法所需要提取的最关键的信息,很大程度上决定了分类结果的好坏。然而,在视频动作识别中,除了静态图像的空间信息能影响分类的结果,动态的时间信息如运动信息,长时依赖关系等也起到了至关重要的作用。传统的动作识别算法一般通过提取静态图像的空间特征来进行识别,或者通过一些额外的算法来提取视频的时间信息。之后对这些分离的信息进行分类,并将结果融合成视频级别的分类结果来实现视频动作识别的目标。然而,在视频中,空间和时间信息往往是密不可分的。分离地提取时间和空间特征并且进行分类无法最大程度地融合两个维度的信息,导致识别的结果欠佳。因此,基于以上观察,本文提出了一种基于深度学习的时空特征学习方式,通过融合卷积神经网络和循环神经网络,在网络前向传播的过程中同步学习时空特征用于视频动作识别。通过使用残差网络和卷积长短期记忆网络,本文设计了一个循环残差网络,在标准数据集上训练并测试,使视频动作识别的效果有了显著提升。并且通过对不同的网络结构进行实验,本文论证了时空特征学习在视频动作识别任务中的重要性。
其他文献
随着国防和军队现代化建设水平的不断提高,军事装备自动化、智能化水平日益提升,机电一体化机动装备如雷达、通信装备的使用,大幅度提升了部队机动化作战能力。与此同时也出
大规模MIMO是新一代无线通信系统的关键技术,虽然它是在传统MIMO基础上发展起来的,但是其各方面的能力和性能却发生了质的变化。信道估计是信号检测、均衡、预编码和波束成型的基础,同时系统中的干扰会影响整个通信系统性能,因此本论文结合大规模MIMO技术对通信系统中的信道估计和干扰估计问题进行了研究。论文的主要研究内容包括以下几个方面:1.论文对大规模MIMO技术、信道估计方法和系统中存在的干扰进行了
海洋中的藻类资源由于其高效的光合作用效率,快速的生长速率以及巨大的资源储量受到了国内外学者的广泛关注。尤其是由于水体污染、富营养化等原因,赤潮、绿潮的爆发愈来愈频
在当下的中国,城市化的进程近二十年以来发展的十分迅速,未来城市的发展是社会进步的必然规律,伴随着城市的建设,城市的构架功能也随之不断重构、组合,现代城市发展所呈现的
随着互联网技术的不断发展和成熟,IP精准定位方法在当今社会体现出越来越重要的作用,网络广告的投放、网络犯罪行为的定位和网络故障的处理都对定位技术效果有着更高的要求。IP定位方法发展到如今,已经涌现出了很多优秀的IP定位产品,但是这些产品存在定位精度不高和需要第三方(基站、GPS等)支持的问题,本文对无第三方支持的基于测量的IP定位方法进行了研究。本文首先研究与分析了当今主流的基于网络时延、网络拓扑
随着传统CMOS(互补金属氧化物半导体)集成电路的尺寸和性能已接近极限,为实现高性能处理器,超导RSFQ(快速单磁通量子)电路被提出。在RSFQ电路中,逻辑单元之间有两种基本的互连方式:约瑟夫森传输线和超导无源传输线,对其建模分析是实现大规模超导RSFQ电路设计的关键。本文对这两种互连方式分别进行了建模和分析研究,主要工作包括两个方面:一、针对约瑟夫森传输线的时域响应分析,根据约瑟夫森结的电阻-电
利用射频磁控溅射技术在不同参数条件下制备二硫化钼(MoS2)薄膜,通过合理控制溅射参数,实现了对薄膜结构和性能的调控。利用扫描电子显微镜(SEM)、原子力显微镜(AFM)、X射线衍射仪(X
建筑代表着一个区域的文化与发展,而历史建筑则更能够从它独特的外形反映一座城市发展的脉络,展示城市文化积淀,支撑一个城市的文化发展。出生并成长于上海的石库门里弄建筑
目的:HIV-1感染引起肠道屏障破坏及功能障碍,导致部分肠道微生物易位进入血液循环。肠道微生物易位刺寧机体,诱导产生免疫应答,进而引起全身免疫系统被激活。由于慢性免疫激
网络技术的发展为人们生活带来便利的同时,也使得信息安全问题日益突出。入侵检测技术是信息安全学科的重要组成部分,是一种主动且有效的动态网络防御技术。传统入侵检测技术