基于深度学习的半监督视频目标分割技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:hefner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频目标分割(Video Object Segmentation,VOS)是指按一定的标准分割视频序列的感兴趣目标,是计算机视觉关键的基础任务之一,是智能视频分析等应用的关键核心,在诸多领域具有广泛的应用前景。在第一帧提供特定的感兴趣目标,在视频后续帧中分割出指定的目标,即为半监督视频目标分割任务。现有基于深度学习的半监督视频目标分割方法仍存在以下几个问题:第一,大多数分割方法使用视频第一帧图像和对应的目标分割掩码在线微调深度网络,使得算法耗时长,难以满足实时分割的需求;第二,部分算法忽略了视频中至关重要的时空上下文信息,分割过程中依赖第一帧给定目标的外观信息,随着视频的播放,网络模型难以适应目标的外观变化,降低算法的时序稳定性;第三,大多数算法通常以简单的通道拼接作为掩码传播的主要方式,使模型对相似目标缺乏判别力,导致对多个相似目标容易产生混淆。针对上述问题,本文以视频数据为研究对象,基于深度学习,对半监督视频目标分割技术进行研究。首先本文采用孪生网络结构,提取参考帧与当前帧之间共同的外观特征,并在当前帧中匹配给定的目标对象,代替在线微调的方式,从而有效地减少目标分割的时间;其次,利用视频中的时空上下文信息,设计基于运动感知的感兴趣区域预测算法以及动态自适应的参考帧更新策略,提升分割的时序稳定性;最后,设计一种基于匹配的视觉注意力机制,进一步提升模型对相似目标的判别力,提升半监督视频目标分割的精度。本文的主要研究工作如下:(1)针对基于在线微调的半监督视频目标分割方法计算量大,分割耗时长等问题,本文提出一种基于孪生网络的半监督视频目标分割方法。首先,参数共享的孪生编码器子网将参考流和目标流映射到相同的特征空间,使得相同的目标具有相似的特征;然后,全局特征提取子网在特征空间匹配与给定目标相似的特征,定位目标对象;最后,解码器子网将目标特征还原,并通过连接目标流的低阶特征,提供边缘信息,最终输出目标的分割掩码。在公开基准数据集上的实验表明,本文方法的分割速度有大幅度提升,同时具有较好的分割效果。(2)针对现有半监督视频目标分割方法依赖第一帧给定目标的外观信息且缺乏时空上下文信息,本文提出一种基于时空孪生网络的半监督视频目标分割方法。首先,基于目标区域的历史运动轨迹,动态感知目标的运动趋势,预测当前帧的目标感兴趣区域,作为分割网络的输入;其次,利用光流信息估计当前帧分割掩码的质量,以此判断是否将其作为新的参考帧,实现在目标分割过程中动态自适应地更新参考帧;最后,根据视频目标分割任务的特点,设计高效的损失函数和训练策略,提高分割精度。在公开基准数据集上的实验表明,本文方法的时序稳定性有大幅度提升。(3)针对大多数半监督视频目标分割方法的网络模型缺乏对相似目标的判别力,且传统掩码传播方式对模型的指导能力较弱,本文提出一种基于视觉注意力机制的半监督视频目标分割方法。首先,三流孪生编码器将输入图像映射到同一特征空间,使得相同目标具有相似的特征;然后,基于匹配的视觉注意力机制将编码器输出的特征进行相似度匹配,并将其加权到当前帧特征,形成视觉注意力,以此关注给定的分割目标,提升模型判别力;最后,基于残差细化的解码器利用残差学习的思想,融合当前帧图像的低阶特征,并使用多级损失监督,逐步提升分割细节。在公开基准数据集上的实验表明,本文方法可以较好地解决目标的相似混淆等问题,并能较为准确地跟踪给定的分割目标。
其他文献
本文以沁水盆地郑庄区块为研究区,以区内无烟煤储层3#煤为研究对象,结合郑庄区块实际的地质参数,建立研究区内不同单元的地质模型,并通过开展Sc CO2注入深部无烟煤储层的吸附
哈贝马斯认为,现代社会片面追求利益使得功能主义的“合理化”成为主流,进而工具理性成为唯一的指导原则。这样所导致的异化问题需要用交往理性解决,而不是依靠纯粹的意识形
中国篮球协会于2017年11月郑重发布《针对6-12岁少年儿童的小篮球发展计划》,明确指出要促进少年儿童的身心健康发展,为国家篮球的发展储备足够的人才。现在,西宁市小篮球运动的发展仍停留在学校推广阶段,小篮球运动还需要对教学体系、课程标准等制度性层面的内容进行改善。本研究的研究目的为深入探析西宁市小篮球运动发展的实际情况,并基于此给出有关的改善措施,进而推动校园小篮球运动的发展和与该运动有关的政策
由于政策红利、市场加码和媒介迭代的影响,加之粉丝拥趸、学者眷注和写手的笔耕不辍,网络文学发展至今二十余年来,始终以独占鳌头的姿态盘踞在大众文学的场域中。近年来,网络快穿小说这一脱胎于网络穿越小说的新星,凭借其独特的快穿魅力以及超体量的文本储备,已然在网络文学各类型作品中脱颖而出。在起点中文网、晋江文学原创网、红袖添香网、创世中文网等网络文学创作平台上,风头正劲,与“盗墓玄幻”“仙侠修真”“校园都市
目的:人延展多能性干细胞(extended pluripotent stem cell,EPS细胞),是由北京大学邓宏魁教授实验室于2017年基于小分子混合物培养基建立的一种新型多能干细胞。EPS细胞表达典型的多能性相关转录因子,如NANOG、OCT4、SOX2等;同时它会上调表达一些早期胚胎内细胞团相关转录因子,如KLF4、DNMT3L等。在胚胎嵌合能力上,EPS细胞显著区别于传统的始发状态的人
重型精密机床的地基施工,都需要二次灌浆,并进行施工养护,施工过程繁复,施工质量要求高,需耗费大量时间,当移除机床时需强力拆除。针对以上问题,结合Bi-Sn-In易熔合金的物理
粉末冶金材料是金属基体和孔隙的复合体,固有孔隙的存在使得粉末冶金材料相对于其致密的铸件而言更易腐蚀,粉末冶金材料的腐蚀不仅发生在材料的表面,而且发生在基体内部。在
随着智能电网系统的蓬勃发展,电力需求不断提高。电动汽车(Electric Vehicles,EVs)制造作为新兴的战略性产业,在智能电网的发展中发挥着巨大的作用。在政府的大力支持下,车辆
随着经济全球化蓬勃发展,信息时代的到来令个人信息与个人利益、经济利益的联系日趋紧密,但是当前我国公民个人信息遭到侵害的境况日趋严重,造成的影响亦愈演愈烈。对个人信息的保护既可以通过法律措施也可通过其他的政策或是技术方式来进行保护,但是相较而言,通过法律保护方式实现对个人信息的保护,有利于形成制度性的、长期性的保护机制,有利于真正实现个人信息保护的目标。但是,从我国现行的法律制度来看,《中华人民共和
6系铝合金具有良好的工艺性能和机械性能,属于中等强度合金。由于其出色的抗挤压性、耐腐蚀性和优异的焊接性能,现已成功地运用在高速铁路的列车车体上。而在众多6系铝合金中,应用最为广泛的同时也是最典型的就是6005A-T6与6082A-T6两种铝合金。轨道车辆在服役过程中面临着意外碰撞事故的风险,列车碰撞问题由于自身的特殊性导致无法通过实验手段验证,而仿真分析能有效的模拟特定工况。材料在高应变率下的应力