基于孪生神经网络的视觉目标跟踪算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:yangwenping666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉跟踪广泛应用于安防监控、虚拟现实、工业制造等领域,其作为人工智能技术重要组成部分,是国内外广大学者的研究重点与热点。视觉跟踪随着过往多年的研究发展逐渐遭遇瓶颈,但深度学习技术的崛起为视觉跟踪研究注入了新的活力,跟踪技术借此获得了令人惊叹的性能跃升,促使该领域迈向新阶段。但是,在现实跟踪过程中却存在着多种挑战因素与复杂场景造成视觉目标跟踪依旧不够精确和稳定的问题,与达到理想的跟踪效果还有一定差距。本文以孪生神经网络为基础进行研究提出了两种视觉目标跟踪算法并设计了一个单目标实时跟踪系统,其主要内容如下:(1)为解决多数孪生网络跟踪算法存在骨干网络特征提取能力弱、模板不适应目标变化等问题。本文在Siam FC(Fully Convolutional Siamese Networks,Siam FC)算法基础上,提出基于可变形卷积的孪生网络跟踪算法(Target Tracking Based on Deformable Convolution Siamese Network,DCSiam)。首先,采用可变形卷积模块在不同方向上学习多层特征数据的自适应偏移量,增大卷积过程中有效感受野。然后,通过多层可变形互相关融合得到最终响应图,以增强骨干网络深层语义特征提取能力。最后,采用一种高置信度模板在线更新策略,每隔固定帧计算响应图的峰值旁瓣比与最大值作为更新依据,使用加权的方式融合特征以更新模板。采用多个公共数据集对算法进行性能评测。实验结果表明,在OTB2015数据集上,DCSiam算法整体精确和成功指标较基线分别提高9.5%和7.5%,很好地实现了复杂场景下目标跟踪的精确与稳定,验证本文所提算法的先进性。(2)针对多数孪生网络跟踪算法只关注模板与搜索区域的相似性,而忽视了跟踪过程中历史帧对于目标渐变过程的重要性以及传统边界框预测较为复杂等问题。本文在Siam FC算法基础上提出了基于时空注意力的孪生网络跟踪算法(Target Tracking Based on Temporal Spatio Attention Siamese Network,TSASiam)。首先,采用非局部操作的时空注意力模块嵌入到骨干网络之中,辅助网络模型学习视频序列中最具判别性的历史帧与帧内区域。随后,采用了逐像素的分类回归的方法,对响应图中像素进行前景与背景的区分,并回归视为相对边界框,通过计算像素点与预测边界框的距离,并联合中心度分支抑制低质量边界框的产生,降低预测复杂度的同时提升目标定位精度。采用多个公共数据集对算法进行性能评测。实验结果表明,在OTB2015数据集上,TSASiam算法整体精确和成功指标较基线分别提高了4.35%和6.00%,较好地实现了复杂场景下目标跟踪的精确与稳定,验证本文所提算法的有效性。(3)依托本文所提基于可变形卷积的孪生网络跟踪算法为核心,利用Flask Web应用框架为基础开发了一个单目标实时跟踪系统。用户输入指定网址进入登录界面,输入账号密码进入到系统后端界面,随后利用按钮和鼠标与服务器端进行交互,实现对上传视频序列或摄像头画面中目标进行选取并持续跟踪。用户端拉动矩形框提供目标初始位置信息,服务器端调用算法模型利用前端提供的信息完成初始化工作并提供跟踪定位服务,并将跟踪定位数据和画面回传至用户端界面,随后对每次跟踪服务进行日志记录。最后对系统多个模块进行性能测试并展示其运行成功效果,验证本文设计的单目标跟踪系统的可靠性和算法的工程意义。
其他文献
砂砾岩储层具有地层厚度大、储层非均质性强、低渗透率、低孔隙度等特点,为其研究带来一定困难。东营凹陷北部陡坡带发育多条古冲沟,形成丰富的砂砾岩油气藏,本文以该区域的盐222井区砂砾岩储层为例,对其进行相带精细描述。通过地震正演模拟,分析地震剖面上的包络面特征,以及时间上提现象,并讨论了不同厚度泥岩夹层对地震相特征的影响。对包络面内部提取多个地震属性,优选出过零点个数属性与砂砾岩储层响应较好。最后对研
<正>近几年,经济全球化的进程正在不断推进,我国的国有企业在发展过程中,需要面对国内外双重经济市场,在这种竞争激烈的经济市场环境中,国有企业若想获得良好的发展,则要做好相应的管理工作,其中内部控制工作的有效开展,能够降低企业风险,提高企业自身的竞争力。因此,国有企业应该提高对内控工作的重视,并且要对内控工作中存在的各种问题予以明确,比如,内控机制不够完善、执行力度不足等,针对这些问题,国有企业要制
期刊
校园重点场所如教学楼、机房和实验室等严禁带入违禁食品是众所周知的规则,因此,违禁物品的识别与分析处理是智慧校园治理亟待解决的问题。以违禁食品进教学楼的应用场景切入,基于领域应用场景优化YOLO检测模型设计实现了智能检测和分析系统,以Python为编程语言,利用TensorFlow平台构建深度学习网络,实现对目标范围内人、食品进行图像抓取、智能识别图像内容、分析图像中人的身份、食品的类别并进行智能决
近年来,学术期刊的数字出版和媒体融合快速发展,期刊传播方式和出版模式发生了重大变化,对全能复合型编辑人才的需求愈发强烈。高校学报青年编辑在职业发展中存在诸多困境:学报编辑队伍角色定位不清晰;编辑人才培养方式相对落后;职称、职务上升渠道狭窄;薪酬体系不够完善。这些问题导致了学报编辑队伍中高层次青年人才匮乏、编辑人才不稳定、流动性大的现象。为了突破困境,寻找出路:青年编辑要坚定职业理想信念不动摇;高校
目前,我国基层消防站建造的消防训练塔设计相对落后,大多为2010年前建造,功能较少,培训方式有限,甚至说是千塔一面,难以满足新发展阶段新要求下消防应急救援的需要。现提出一种新型消防训练塔设计方案,将高空绳索救援、深井救援、烟雾模拟救援等按照模块集成为集装箱式训练塔建筑,旨在拓展训练塔训练功能,提高消防救援人员的实战能力。
臭氧对四川空气质量有着显著的影响,研究臭氧污染特征对城市大气污染防治精细化管控有着重要指导意义。利用2016~2020年四川省21个城市94个国控空气质量自动监测站的在线监测数据,采用数理统计的方法,对“十三五”期间四川省臭氧(O3)污染状况进行分析。结果表明:“十三五”期间O3-8h的90百分位浓度呈逐年升高趋势,年平均升高3.0μg/m~3。夏季浓度最高,冬季浓度最低,春季O3污染呈现逐年加重
为了更好地评估和应对工程施工项目进度管理过程中出现的各类风险,本文以某市房地产公司S项目为例,采用层次分析法来确定各级风险因素指标,采用模糊评价法来确定各级风险因素的权重,基于各级权重结果得到工程施工进度风险的综合评价,并提出相应防范措施,以应对可能出现的风险。研究表明,模糊综合评价方法可以根据案例目标来定制个性化风险评价指标,量化项目进度风险指标的影响程度,有效控制工程施工过程中可能产生的施工风