论文部分内容阅读
目标追踪是计算机视觉、机器智能的基础研究课题之一。该技术能够为计算机提供目标在图像序列中的大小和位置,从而进行下一步的分析和处理。在现实世界中,目标追踪在安全监控、人机交互、自动驾驶和控制、医学成像和军事领域等都有着重要的应用价值。但由于在实际应用场景中,存在遮挡、旋转、背景聚类、快速移动和图像模糊等复杂情景,致使追踪算法性能下降,无法达到令人满意的效果。本文首先分析当今目标追踪算法的主要框架——检测跟踪(Tracking by detection),从分类方法的角度出发,进行了判别字典学习机制的研究。通过利用1,∞范数,能够自适应地将类相关性信息加入到字典原子之间,达到联合稀疏的效果,实现了类相关性引导判别字典学习的方法。该方法结合全局字典学习和分类字典学习的优点,在图像分类上取得了较好的测试效果。在此基础之上,又进行了相关视觉追踪方法的研究。该技术也使用Huber损失函数代替2范数以减少重建项残差增加速度,添加了更加容易求解的Fisher判别项,从而提出了在线判别字典学习的追踪方法。至此,本文实现了第一个目标追踪算法,并与基于稀疏表示的追踪算法等相关方法比较,在视频库上取得了较好的效果。上述的目标追踪技术虽然能够在特定场景上取得较好的测试效果,但无法满足实时追踪的要求。而基于协同滤波器的追踪方法,能够实现高速追踪,故本文又进行相关技术的研究与实现。文中使用逻辑回归的方法设计滤波器,并实现了在非线性情况下的处理方法。同时创造性地利用Laplace分布生成判别标签,采用特征融合的方式表示目标外观形态,并在多个目标尺度下预测最合适的物体大小,提出了能够实时追踪的核化逻辑回归协同滤波算法。此技术在视觉追踪标准库上和其它先进方法相比,不论是速度还是准确度都有着明显的优势。最后,本课题使用C++语言、MFC界面设计和开源库OpenCV实现了目标追踪系统,该系统主要包含了两种模式下的目标追踪:使用摄像机实时跟踪和离线跟踪模式。该系统还提供了参数调试功能,可以在不同的应用场景下调试合适的参数。