【摘 要】
:
近年来,监控摄像头在机场、学校等人口密集场所得到广泛应用,其在保护公共安全的同时,也带来了海量监控图像。为实现对目标行人的快速精准定位,行人搜索技术应运而生,成为智能监控中的关键技术。行人搜索即利用计算机图像处理技术,在监控摄像头采集到的图像库中快速找出特定行人。其使用的网络模型、损失函数及图像处理算法也会推动相关领域的研究,具有重要的研究价值。早期行人搜索主要利用给定的行人图像进行基于可见光图像
论文部分内容阅读
近年来,监控摄像头在机场、学校等人口密集场所得到广泛应用,其在保护公共安全的同时,也带来了海量监控图像。为实现对目标行人的快速精准定位,行人搜索技术应运而生,成为智能监控中的关键技术。行人搜索即利用计算机图像处理技术,在监控摄像头采集到的图像库中快速找出特定行人。其使用的网络模型、损失函数及图像处理算法也会推动相关领域的研究,具有重要的研究价值。早期行人搜索主要利用给定的行人图像进行基于可见光图像的单模态行人重识别,随着研究的深入,逐步发展到基于红外—可见光的跨模态行人重识别,以及在整个视频序列和开放场景中查找目标。本文分析了不同类型行人搜索技术的研究现状,并基于深度学习的方法,针对单帧行人图像搜索任务,分别对只含可见光图像的单模态行人重识别、红外—可见光图像的跨模态行人重识别进行了深入研究,主要工作如下:(1)针对单模态的行人重识别任务,设计了一种基于全局空间注意力机制的行人重识别模型。该模型以Res Net-50作为骨干网络,加入全局空间注意力模块来提取更具表征性的图像特征。其中全局空间注意力机制通过通道压缩,将多通道信息变为单通道信息,减小了计算成本,且经过全局特征获取处理,最终的特征图融合了单一点和所有点关系,提高了特征表示的判别性。最后利用交叉熵损失进一步提高识别精度。该方法在Market1501和Duke MTMC-re ID数据集上表现出良好性能。(2)针对跨模态的行人重识别任务,考虑到现有方法在模态融合及特征表达等方面的不足,设计了一种基于双路网络的跨模态行人重识别模型。首先通过灰度转化将可见光模态和红外模态的行人图像均转化为灰度模态,使不同模态图像间的差异减小。然后,使用结构相似但参数不共享的两个特征提取模块分别提取不同模态图像的特征,其中特征提取器采用多粒度的方式,使网络能够更多关注图像细节特征。最后,将改进的身份损失和异质中心损失相结合,进一步提高网络的学习能力。在Reg DB和SYSU-MM01数据集上的实验结果清楚地展示了该模型具有较高的准确性。
其他文献
随着装备制造智能化、微型化的快速发展,计算机零部件、集成电路、引线框架等越来越多的应用在精密仪器中,各种精密仪器也对其基础核心零部件的力学要求越来越高,不仅仅对零件的尺寸精度,还对其力学性能、导电性能都提出了更高的要求。薄带作为制造、加工领域的原材料,其在轧后的力学性能,会对生产精密仪器核心部件的质量产生重要影响,薄带在轧后的力学性能,与轧制过程中产生的残余应力密切相关。因此,本文针对薄带在轧制过
作为煤炭生产大国,煤矿事故是威胁煤矿安全生产的最大威胁。随着“互联网+工业”的发展,越来越多的学者将精力投入将计算机技术应用到煤矿事故领域的研究中。通过对已有的海量煤矿事故案例文本数据进行归纳总结,结合知识图谱理论和技术,构建煤矿安全生产知识图谱,挖掘事故实体间的关系,对煤矿生产过程进行监控,从而避免煤矿事故的发生。命名实体识别是构建知识图谱的第一步工作,为给煤矿安全生产知识图谱的构建奠定基础,针
视频图像去模糊是计算机视觉领域的一个研究热点。近年来,随着计算机信息技术和人工智能的迅速发展,智能手机、数码相机等摄影设备也得到了日新月异的发展和普及。作为当今被最广泛使用的信息载体之一,视频图像更加直观地向人们展示了大量有用的信息,能够为人类记录美好生活、分享快乐回忆、以及传递人与人之间的情感。另外,在应用方面,无论是校园、工厂、煤矿下等场景的监控都需要高清稳定的视频图像,那么去除视频图像中的模
随着科技的飞速发展,直流伺服系统的控制精度和稳定性也得到了提升,其在工业生产和日常生活中得到了更加广泛的应用,但是直流伺服系统的工作环境复杂多变,而且在实际运行过程中存在参数时变的情况,传统整数阶PID控制存在着一定的局限性,分数阶PID由于引入了分数阶次,因此在参数的选择上更加灵活,能够提高直流伺服系统的控制性能。针对直流伺服电机跟踪性能与抗扰性能的独立控制问题以及重复输入信号下的跟踪问题,本文
β-Ga2O3是一种新型氧化物半导体材料,具有宽禁带,良好的光学性能,高击穿场强和抗辐射性,在高功率、低损耗半导体器件制备方面具有很大优势。电子辐照可以在β-Ga2O3晶体内形成氧空位(VO)与氧间隙(Oi)缺陷。然而,目前关于β-Ga2O3缺陷的研究主要集中在生长过程中形成的缺陷,而关于β-Ga2O3电子辐照缺陷的研究很少。这严重制约了β-Ga2O3器件性能的辐照调控技术发展,进而影响了β-Ga
命名实体识别(Named Entity Recognition,NER)任务在自然语言处理领域占据着基础且关键的地位,其目的是识别出文本中存在的具有特定意义的实体名称。命名实体的识别结果将会影响诸如信息提取、情感分析和知识图谱等一系列自然语言处理的后续任务。当前对深度学习的研究进展不断深入,利用深度学习来解决命名实体识别任务将有非常重要的意义。本文采用深度学习方法针对命名实体识别任务主要做了以下工
化石等不可再生能源大量、长时间的使用,不仅使得全球能源逐渐枯竭,而且也使得环境不断受到污染,因此可再生使源受到越来越多的关注。近年来风力发电作为可再生能源的主力军,在发电领域的地位也是越来越高,随着风力发电规模稳步增长的同时,风力发电机的故障逐渐成为其发展的难题,其中轴承作为风力发电机重要的传动部件,因此风力发电机轴承是否能够的稳定运行直接影响着风力发电机的发电效率与运行安全。本论文通过对风力发电
云计算经过多年的研究和发展已经成为了信息技术领域不可或缺的一部分,通过资源动态管理实现资源整合与共享,按需分配资源为用户提供服务。随着计算机技术和通讯技术的高速发展,虚拟化技术也在人类的生产生活方面带来了巨大的影响,越来越多的企业特别是中小企业都将应用部署在云上,这样不仅节约占用的实际空间,也可以提供方便的计算和存储服务。然而,由于云环境中的随机性,运行方式和用户需求的不可预测性,给任务调度带来了
周期性正弦信号的跟踪控制问题广泛存在于电力电子、伺服驱动以及精密制造等工业领域,跟踪控制的精度严重影响着生产性能。由于正弦信号属于中性稳定系统,如何对保证系统的稳定性和跟踪的快速性是重要的研究内容。本文设计了一种正弦等效重构方法实现对周期信号精确快速的跟踪。该方法分析了参考信号与其频率以及系统响应之间的关系,利用等效重构方式设计控制器结构和参数。通过对控制器参数的分析和调节,保证了控制性能的稳定性
为满足岸边集装箱装卸桥高效率的装卸要求,促进港口物流行业的蓬勃发展,同步实现岸桥小车精准定位和吊载摆动控制是热门的研究课题。根据有无反馈信号,防摆技术主要有开环控制、闭环控制,其中开环控制对数学建模要求较高,鲁棒性差,所以控制效果一般;闭环控制在作业过程中实时采集摆角,控制效果较好。所以本文采用闭环控制方法对岸桥吊载摆动控制进行研究。首先建立岸桥吊载摆动系统的数学模型,利用分析力学中拉格朗日方程法