基于场景迁移与区域对准的行人再识别

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:realg007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别技术是智能视频监控中的一项关键技术,该技术研究跨摄像头的行人识别与跟踪问题,根据查询行人图像,检索该目标行人是否出现在其他场景中。行人再识别可以应用于刑事侦查、失踪人员检索、多摄像机行人跟踪和行为分析等领域,是目前计算机视觉领域的研究热点。由于摄像机采集图像的时间和位置不同,获取的行人图像不可避免地存在背景、视角、光照和行人姿态的变化,导致同一行人在不同监控场景下存在很大差异,使得行人再识别问题面临巨大挑战。本文主要研究基于场景迁移与区域对准的行人再识别方法。主要研究内容有:首先,在当前公开行人再识别数据集中存在行人与行人检测区域不贴合的问题,这种问题主要表现为数据集样本背景面积过大,背景物体干扰等情况,会对于行人特征的提取和识别造成影响。因此,本文提出了基于语义分割的滑动窗口对准法(Sliding Window Alignment,SWA)。方法使用Mask RCNN和Refine Net提取出的前景区域进行未对准检测,并将图像在竖直方向分区,获取行人在图像中的位置,使用滑动窗口机制,使得行人的轮廓更加贴合输入图像的边界。其次,针对目前现有行人再识别训练样本不足以及识别率不高的问题,提出基于行人特征恢复的场景迁移方法(Pedestrian Feature Recovered GAN,PFRGAN)。使用语义分割方法(Refine Net)对前景行人区域进行分割,对背景区域部分使用生成式对抗网络进行各个场景之间的图像迁移,从而在保留行人特征的前提下生成出具有更多背景变化的辅助数据集。最后,基于前两部分对行人再识别数据集进行了对准和补充,根据数据集的调整,改进残差卷积神经网络结构Res Net-50,提出双路特征扩展网络(Double-path Augmentation Net,DFANet),在原始结构中增加全局特征分支,将对准后的原数据集和补充数据集分两路进行训练。同时加入Drop Block机制,丢弃特征图中具有语义信息的区域,增加其他区域在识别中的权重。并且对于生成的补充数据使用标签平滑机制(Label Smoothing Regularization,LSR),抑制了正负样本在输出中的差值,从而提升了深度学模型的适应能力。实验中将本文提出的方法在公共数据集Market-1501和Duke-MTMC-re ID上进行测试,最终在两个数据集上Rank-1指标分别取得了92.2%和83.4%的准确率。
其他文献
目的:比较经尿道钬激光前列腺剜除术(HoLEP)与经尿道前列腺电切术(TURP)在治疗良性前列腺增生(BPH)的优缺点。系统评价经尿道钬激光前列腺剜除术在治疗前列腺增生症的有效性
随着网络数据量的日益增加,数据中心的兴起,以及超级计算机的发展都对短距互联提出了更高的要求。传统的铜导线连接方式由于大的串扰和高的传输损耗,无法实现高速信号传输的
随着地铁隧道热堆积问题逐渐显现,为缓解此问题,地铁废热源热泵系统作为地源热泵系统的一种新的研究方向被专家提出来。利用地铁废热源热泵系统可以将地下空间内产生的热量吸
研究背景:表观遗传学(epigenetics)是指在不涉及基因或者是蛋白质表达的DNA序列改变的情况下,基因或者是蛋白质的功能产生变化,并且产生可以遗传的表型,是遗传学的又一分支学
本文在系统搜集及消化矿床勘查成果资料和相关文献,全面了解西藏蒙亚啊铅锌矿床地质特征基础上。根据成矿预测必须确定成矿要素和方法要素,构建预测模型的基本思路;通过深入
空气污染物是一种以气态形式进入近地面或低层大气的外来物质。空气污染不仅给生物的生存和发展带来危害,还会造成物体的腐蚀。甲烷作为主要污染气体之一,对甲烷浓度的实时在
目的探索肾癌A498细胞系在氧化应激状态下自噬发生的机制及其对细胞凋亡的影响,为探索治疗的新方法提供实验依据和理论基础。方法1.应用不同浓度H2O2以及不同作用时间分别干
约4.5至4.7亿年前水生植物登陆,陆地先锋植物苔藓逐渐遍布全球,是南极等自然环境极端恶劣地区的主要植被。藻苔(Takakia lepidozioides)是迄今发现的最原始其系统发育位置曾
第一部分 MS-275联合顺铂对ErbB3过表达膀胱尿路上皮癌细胞的杀伤作用及机制研究目的ErbB3是表皮生长因子受体(ErbB/HER)家族的一员,其在肿瘤的发生发展过程中起着重要的作用
目前,我国社会的主要矛盾已转变为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾;其中,区域发展不平衡已成为制约我国国民经济健康持续发展的重要掣肘因素。内