基于深度学习的视频描述方法研究综述

来源 :天津理工大学学报 | 被引量 : 0次 | 上传用户:hymalong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术在计算机视觉领域与自然语言处理领域的突破性进展,图像描述和视频描述的跨模态研究不断涌现.由于视频的时序特征以及视频内容的多样性与复杂性,视频描述相对于图像描述来说具有更大的挑战.视频描述的方法可以归纳为两类:基于模板的方法和基于编码-解码的方法.本文将着重介绍采用深度学习技术的编码-解码方法,文章首先对模型结构的发展做了分析与比较,其次对现有的方法做了归纳与总结.接着,介绍了一些比较有影响力的数据集和评测标准,最后对尚未解决的关键问题与研究难点做了总结与介绍.
其他文献
柘枝舞,以其自成一格的审美风韵、不胜枚举的颂扬诗作、百载扬名的风靡程度,成为唐朝时期著名的三大西域胡舞之一,并在深入探究唐王朝乐舞艺术与乐舞交流方面占据着举足轻重
为了解决高铁摩擦片编码识别应用中的字符区域分割和方向矫正问题,本文提出了基于YOLO_v3和Tesserac5.0的字符识别算法.首先,利用YOLO_v3网络截取含有字符的感兴趣区域,其次利用本文提出的单行字符矫正算法对图像进行矫正.最后,将灰度化、阈值化后的字符图像输入到基于长短期记忆网络的Tesseract5.0算法中实现字符识别.实验结果表明,本算法有效解决了字符区域提取的问题,并解决了单行
在现代这个生活节奏和信息传播高速的时代,艺术作为关怀“人”的功能越来越显著。本创作旨在用颜色釉绘画艺术来寄托心中对世界的爱意和美好的理想,通过塑造诗意的画面气氛来关照内心,关怀“人”。本创作的灵感来源于现代诗《镜中》,把对诗的感悟和私人境遇、私人心态结合,生成自己内心的镜中。接下来探究把心中诗镜转化为画中诗意的方法。一是诗画融合的要点,诗画的精神目的、实现目的的途径、造境的技法都是相通的,都是通过
权利失效制度是指权利人在相当期间内不行使他的权利,导致义务人依该情况正当信赖权利人已经不再行使他的权利,或不想要义务人再履行他的义务,在这个情形下,基于诚实信用原则
近年来随着科学技术的发展,人脸识别已经走进了人们的日常生活中,其在如刷脸支付、身份验证、智能考勤等很多方面得到了广泛的应用。并且,随着软件算法与硬件能力的进步,人脸识别技术也越来越接近成熟。不过,在现实生活的应用中,人脸识别技术仍然受到诸如光照、表情、衣物遮挡和姿态变换等因素的干扰。其中,人脸的多姿态性是目前人脸识别技术研究的重点与难点之一。本文针对多姿态人脸识别技术进行探讨和研究,主要包括基于聚