【摘 要】
:
智能监控系统是一种针对视频监控系统提供的信息进行智能理解与分析的智能系统,被广泛应用在智能安防、智慧交通等领域。其中,行人重识别技术是智能视频监控系统中的关键技术与核心内容,该技术旨在判别由不同视域摄像机采集的数据中行人的身份,能够在大规模监控网络中对行人进行快速、高效的排查和追踪。现阶段,行人重识别研究主要集中在场景单一、模态单一、标签充足的封闭场景上。然而实际的应用环境往往是开放场景,场景中复
论文部分内容阅读
智能监控系统是一种针对视频监控系统提供的信息进行智能理解与分析的智能系统,被广泛应用在智能安防、智慧交通等领域。其中,行人重识别技术是智能视频监控系统中的关键技术与核心内容,该技术旨在判别由不同视域摄像机采集的数据中行人的身份,能够在大规模监控网络中对行人进行快速、高效的排查和追踪。现阶段,行人重识别研究主要集中在场景单一、模态单一、标签充足的封闭场景上。然而实际的应用环境往往是开放场景,场景中复杂性因素较多,因此面向封闭场景的行人重识别模型在开放场景上所取得的检索性能无法满足真实监控场景对方法提出的性能需求。面向开放场景的行人重识别研究的挑战包括:固定视域监控环境下的单一场景复杂性、跨视域监控环境下的跨域场景复杂性和跨视域监控环境下的未知场景复杂性。上述三个方面的复杂性具体表现为:(1)在单一复杂场景中,可获取的行人图像往往是信息不完备的。场景图像中的行人易被其它行人或物体遮挡,甚至无法获取到具体图像,只能依靠目击者对目标行人的文字描述来检索,导致现有方法缺乏鲁棒性;(2)在跨域复杂场景中,无法在新场景中获得充足的带人工标注的数据,成像环境动态变化的跨域分布差异较大使得现有重识别模型直接迁移性能较差,导致现有方法迁移能力不足;(3)在未知复杂场景中,由于特定场景涉及隐私问题,难以采集对应数据进行训练,导致现有方法泛化性较差。本文针对面向开放环境的行人重识别中亟待解决的难点问题,展开如下研究:针对单一复杂场景的遮挡行人重识别问题,设计姿态引导的特征对齐与知识蒸馏网络。该网络强调可见身体部位的特征,同时排除障碍物和背景的干扰,并鼓励特征的不同通道组专注于不同的身体语义部位,帮助特征之间实现身体部位语义对齐,以提高检索性能。同时,本方法通过知识蒸馏方法和基于交互的训练策略将姿态引导分支的信息蒸馏给主分支特征,在测试阶段摆脱了整体网络对姿态估计器的依赖,提高检索速度的同时保证了检索精度。针对单一复杂场景的自然语言-可见光行人重识别问题,设计了基于Gumbel Top-k重参数化算法的层级Gumbel注意力网络,该网络从图像和文本中自适应地选择强语义相关的图像区域和单词/短语进行精确的对齐和相似度计算。这种硬选择策略能够融合强相关的多模态特征,构建高语义相似性模态互转空间,以缓解语义错位和匹配冗余问题。针对跨域复杂场景的域自适应行人重识别问题,提出了两种标签去噪方案:硬标签去噪和软标签去噪。对于软标签去噪,基于不确定性引导的标签去噪算法通过教师模型和学生模型输出特征的相对熵作为一致性度量来估计样本伪标签的不确定性,并根据该不确定性设计对应软标签去噪策略抑制噪声样本在训练时对模型的负面影响,从而有效提高了模型在目标域的自适应能力。对于硬标签去噪,基于多粒度组感知的优化传输算法通过多粒度组感知策略将单维度行人图像映射到多粒度组特征,对行人图像建立多粒度组特征表达,并用优化传输算法实现多粒度组感知特征对应的硬标签去噪,以实现对新场景的快速适应。针对未知复杂场景的域泛化行人重识别问题,提出了校准特征解耦模块,利用通道注意力机制将行人特征解耦为身份相关特征、场景相关特征和强耦合特征。为了给上述校准特征解耦模块提供易解耦的行人表征,设计了标准-标定批归一化层和校准实例归一化层,通过校准归一化操作加强模型对身份相关信息的辨别能力,在域泛化行人重识别数据集上的实验结果表明了该方法能有效提高模型的泛化能力。本文基于上述三种复杂场景重点探索多域多模态行人重识别方法研究,针对模型鲁棒性、适应性、泛化性不足的核心问题,重点探索跨域、跨模态数据中不变性特征学习,构建不同领域、模态间知识迁移桥梁,减小数据分布差异,推动具有高鲁棒性、高适应性、强泛化性的行人重识别系统发展。
其他文献
氢经济描绘了一个洁净、安全和可持续发展的以氢气为能源媒介的经济结构体系:利用水电解池制备氢气,将太阳能、风能和潮汐能等可再生能源产生的电能储存到高能量密度的氢气中;然后利用氢燃料电池将氢气分子中的化学能高效有序地释放,不会产生污染物。然而,当前驱动水电解池和氢燃料电池电极反应的贵金属催化剂(Ru、Ir、Pt等)资源稀少,价格高昂,不能解决全球巨大的市场需求。相比之下,非贵金属储量丰富且价格低廉,成
中小企业已成为经济发展的中流砥柱,但是资金短缺成为制约众多中小企业正常运营和持续发展的难题。随着企业的不断探索与实践,近年来第三方物流企业(Third-Party Logistics,3PL)和平台越来越多的参与到供应链中成为供应链重要的参与者,为资金约束的企业提供融资服务。因此,在供应链中第三方物流融资和平台融资成为不可忽视的融资途径。对于不同融资困境下的中小企业,在面临多种融资方式时,如何进行
金属-有机框架(Metal-Organic Frameworks,MOFs)是一类由金属离子或金属簇(也被称为次级构筑单元)与有机配体通过配位作用形成的新型有机无机杂化多孔晶态材料。由于MOFs具有结构多样、可裁剪、可设计等特点,同时其比表面积高、孔隙率大,MOFs从被报道合成以来就被广泛关注,并在气体吸附与分离、药物化学、催化、化学传感等领域均表现出优良的应用前景。MOFs的开放性孔道有利于底物
目前星载多普勒测风激光雷达作为获取全球风场信息最为有效的探测设备之一,已经成为了国际上备受关注的热点领域。国内的相关科研单位也在积极开展有关研究,已经提出了开展直接探测和相干探测结合的复合体制星载测风项目,目标是获取0km~30km高度范围的全球三维风场信息。本论文基于该复合体制星载测风项目,针对其中的直接探测接收机和相干探测水平风场反演技术进行了研究。本论文首先对复合体制激光雷达系统中的直接探测
GW150914信号的成功探测宣示着人类进入引力波天文学时代。一般认为天文学起源的黑洞宏观不带电,所以在引力波数据分析研究中都不考虑电荷量的影响。但是根据广义相对论的无毛定理,黑洞性质由且仅由其质量、自旋和电荷量这三个参数决定。而两个黑洞并合过程中辐射的引力波信号就包含了黑洞的这三个参数的信息,所以研究黑洞电荷量对引力波信号的影响具有重要意义。引力波信号包括旋近、并合和铃宕三个阶段,其中并合阶段只
铁基合金成本低廉,具有良好的机械性能、加工性能及较好的抗氧化性和耐腐蚀性,是生产生活中应用最为广泛的一类结构材料。然而,当其在海洋、盐雾等苛刻环境中服役,将面临严重的氯离子腐蚀问题,限制了其应用范围。金属材料的耐腐蚀性高度依赖于其表面氧化膜的物理化学特性,这层氧化膜是离子传输、金属溶解和材料退化的保护性屏障。从电子/原子尺度研究氧化膜形成和钝性失效机制,以及合金化作用对其的影响,有助于深入理解铁基
若个体不能确定有意义的长期目标并取得相应进展,就会对个体幸福感造成很大的负面影响。然而,许多人很难找到有意义的长期目标,尤其是未来工作自我。即使是那些成功找到自己远大目标的人,也常常无法实现这些目标。在这篇论文中,我们使用思维模式-行动阶段理论作为总体理论,提出了一个描述长期目标追求三个不同阶段的框架,并探究了自我反思在每个阶段的重要作用。思维模式-行动阶段理论指出,追求目标的过程可以分为四个阶段
低杂波电流驱动(LHCD)是目前托卡马克的主要辅助加热与驱动方式之一,被广泛地运用到各大装置上。随着装置的运行参数不断提高,更高的等离子体电子密度和温度会对低杂波驱动能力有较大的影响,特别是在刮削层中,低杂波与等离子体的非线性效应会很明显改变低杂波的电流驱动效率,包括参量衰变、碰撞吸收以及低频电子密度涨落引起的波散射等。目前,参量衰变和碰撞吸收的研究表明,参量衰变会使低杂波的频谱发生较大的展宽并且
<正>在党的十九大精神指导下,国华电力公司深入落实国家能源集团"一个目标、三型五化、七个一流"发展战略,大力推动《创世界一流企业行动方案》落地实施,全力营造"留人聚才、干事创业"软环境,加快落实战略人才工程。其中,"青年干部培训"是公司战略人才工程落地实施的关键行动之一。为此,国华电力公司致力于在方案设计、精益运营等方面积极进行创新实践,力求通过更能激发青年干部潜力的培训项目,科学培养能承担并愿承
随着习近平总书记“碳达峰、碳中和”目标的提出,锂离子电池作为一种高效新型能源的储能载体备受青睐。锂离子电池的充放电是一个耦合电化学、力、热等多物理场的复杂过程,传统的实验方法难以获取电池内部从微观到宏观的多场耦合特性和机理阐释。本文以数值模拟手段为主,辅以实验表征和验证,针对锂离子电池内部电化学-力-热耦合关系复杂和机理不清等问题,从模型建立、机理分析和模型应用三个方面展开研究。首先从微观至宏观层