论文部分内容阅读
当前,在互联网上传输的视频数据占据了网络流量的大约70%。毫不夸张的说,视频数据是大数据时代最大的数据。如何让计算机更好的看清与理解眼前的世界不是一个简单的问题,近年来也一直是计算机视觉研究的热点。近年来深度学习的算法获得了快速发展。基于深度学习的计算机视觉方法在大部分情况下能更好的解决计算机视觉的相关任务,目前已经是产业界与学术界的共识。为了更好的让计算机理解镜头前的景物,本文探索计算机视觉应用中的众多核心算法,以社会需求与自己的实际项目为驱动,对计算机软件,硬件与相关算法进行综合设计与研发。本文分为两个部分,第一部分是本人以多目标检测,多目标跟踪等为切入点进行研究开发。第二部分是本人挖掘社会实际需求研发完成的三个互相关联的项目。 在所完成的项目中,主要研究了计算机视觉中的以下问题: 1.用基于深度学习的算法对每一帧进行多目标检测已经能够达到实时,但是对每一帧图像进行目标检测无法确定前后帧之间同一个目标的关系,这样无法得知目标在场景中的运动轨迹,目标出现和离开位置与时间等。为解决这个问题,本文设计了一种综合外观与运动特征的高速目标跟踪算法与多目标检测算法进行结合,实验对比传统的基于移动侦测与多目标跟踪算法在实际项目应用中的效果表明本文方法具有检测跟踪速度快,效果好的特点。 2.基于深度学习的目标检测算法对较大的目标,例如行人车辆检测效果较好,但是对视频中较小目标例如行人的衣着,车辆的年检标志检测效果较差。经过分析这是由于卷积神经网络在特征提取中,由于卷积与池化造成特征精度不够因而难以准确的定位。为了解决这个问题本文采用了串级神经网络的方法进行场景中目标细节的分析。将一级检测网络检测到的目标从图像中取出,投入二级网络进行精细化识别,较好的解决了对视频中目标细节特征识别的问题。 3.在实际的项目应用中串级神经网络对远处的较小的目标进行精细化识别依然效果不够理想。经过分析这主要是由于远处的目标在镜头中分辨率特别低,深度学习算法对小目标检测效果不好,对目标的细节特征确认困难。为解决这个问题,本文设计了一套硬件系统,系统采用云台控制的变焦镜头对固定枪机检测并跟踪的目标逐个进行细节抓拍,之后识别人脸,针对室外远程抓拍到的人脸容易受到光照影响的问题,论文利用GAN网络进行了光照修复,经过对比,本文方法优于传统的图像增强算法。 4.为了在系统层面解决传统的监控系统难以兼顾看得广与看得清的问题,本文设计实现了一种基于增强现实的摄像头AI高点立体云防控系统。并介绍了其中的核心算法一种基于神经网络的增强现实坐标关联算法。为了提升增强现实标签的定位精度,需要获知场景中的目标深度信息,但又不能增加系统的硬件成本。论文提出了一种基于GAN的单目深度估计方法,设计了一种环式损失函数。这种方法在NYU-Depth数据集上对比之前的方法取得了较好的实验结果并具有较大的改进空间。 5.高空抛物检测系统是社区安防监控结构化系统的一部分,但是目前尚未有一种真正有效通过视频来检测高空抛物的手段。目前虽然有一些基于计算机视觉的产品采用移动侦测算法,来检测高空抛物的过程,但这些产品实际效果并不理想。这主要是由于监控图像背景变化复杂,单一的利用计算机视觉的方法很难解决高空抛物检测问题。本文介绍了一种利用无线信号回波多普勒效应检测到目标坠落的时间,利用交叉布置的多点枪形摄像机对居民楼进行录像,利用双目视差法计算抛物楼层与窗口进行取证的方法。本文方法采用无线信号处理的方法解决计算机视觉中的难点,取得了较好的实际应用效果。