【摘 要】
:
卷积神经网络在计算机视觉领域得到了大量的应用,尤其是基于卷积神经网络的目标检测方法目前在学术界和工业界都受到了广泛关注。然而,由于卷积神经网络具有较高的计算复杂度,目前目标检测方法通常依靠大型服务器如GPU(Graphics Processing Unit)进行运算。但是,当前GPU平台存在功耗高、体积大以及成本昂贵等缺陷,使得基于卷积神经网络的目标检测方法难以应用于移动机器人、无人机等轻量化平台
论文部分内容阅读
卷积神经网络在计算机视觉领域得到了大量的应用,尤其是基于卷积神经网络的目标检测方法目前在学术界和工业界都受到了广泛关注。然而,由于卷积神经网络具有较高的计算复杂度,目前目标检测方法通常依靠大型服务器如GPU(Graphics Processing Unit)进行运算。但是,当前GPU平台存在功耗高、体积大以及成本昂贵等缺陷,使得基于卷积神经网络的目标检测方法难以应用于移动机器人、无人机等轻量化平台。针对轻量化、快速的目标检测难题及需求,本文以经典的基于卷积神经网络的YOLOv2目标检测方法为例,基于FPGA平台,设计了一种软硬件协同的、资源能量感知的目标检测算法加速系统硬件平台,并研究了卷积神经网络硬件加速方法,实现了基于FPGA的目标检测算法的加速研究。文章的主要内容如下:首先,针对高性能的目标检测加速系统硬件平台设计,本文基于CPU+FPGA异构架构,开发了一种资源能量感知的FPGA加速器。在CPU端,设计了基于FPGA平台的目标检测系统的图像预处理和图像后处理模块,分别对输入和输出的图像进行相关变换操作,使其满足加速器输入和检测的要求。在FPGA端,提出了基于并行分块执行的卷积层加速方法和基于动态定点量化的参数量化加速方法,保障了目标检测的运算速度和系统平台的低功耗运行。通过以上的研究,实现了高能效和高性能密度的目标检测算法加速系统硬件平台的设计。其次,为了有效提高目标检测算法的运算速度,本文研究了卷积神经网络的硬件加速方法。一方面,设计了一种动态定点数据量化方法,通过对卷积层的参数进行16位的定点数据量化,减少参数的复杂度和片外存储量,保障了系统的计算速度。另一方面,提出了一种分块并行卷积算法,通过设计循环展开方法,实现了对输出和输入特征图个数的二维展开,提高了卷积运算的执行并行度,实现了对系统平台运算的加速;并且研究了一种循环平铺方法,实现了片上资源分块复用,减少了片外数据与片上数据的传输次数,进而降低了系统运行的延迟,提高了基于卷积神经网络的目标检测算法的运算速度。最后为了验证加速器系统平台的性能,本文从加速器系统的能效、性能密度以及目标检测性能等方面展开相关实验。实验结果表明,本文设计的基于FPGA的目标检测硬件加速系统平台实现了对目标检测的轻量化的能量资源友好型加速,验证了所设计的FPGA加速器系统平台具有良好性能。
其他文献
当下网络技术不断创新,互联网行业自身发展趋于成熟,与各领域的关系愈发密切,互联网产品数量呈爆发式增长,导致产品同质化严重、用户流失、获客成本高昂等问题。用户使用APP过程中的决策行为,是APP用户的长期稳定使用产品的关键。聚焦APP用户不同决策场景与阶段的情感体验,以情感代入的方式来引导APP用户使用中的决策行为,维持良好的情感关系,形成稳定的使用习惯,是本文研究的重点。本文基于APP用户情感代入
光场相机是一种新型的多目成像设备,通过单次拍摄可获取场景的空间和多视角信息。利用光场数据可以估计场景深度,在三维重建等计算机视觉领域具有广泛应用。目前,基于深度学习的光场深度估计性能得到了显著提升,但随着输入成本的增加以及网络的加深,现有的光场数据集难以支持大规模网络的训练。同时,经过合成场景训练后的网络,在真实场景下的估计效果不佳。围绕上述问题,本文对光场重聚焦原理以及EPI图像进行分析,开展光
随着互联网时代的发展,信息安全问题日益突出,数字水印作为版权保护和身份认证的手段备受关注。它常用于地质勘察和军事通信等领域。为了保护勘察信息,同时避免图像被恶意盗取和篡改,人们将需要保护的信息当作水印嵌入到图像中。又由于户外勘察会受到天气的影响,遇到雾霾天气时会使拍摄到的图像质量降低。为了提高图片的质量,去雾也成为研究的热点问题。针对以上问题,本文提出一种基于去雾加速器的数字水印系统,在去雾的同时
目前,全国主要的医疗机构基本上都搭建各自的网上预约挂号系统或者电话挂号系统,但是从近些年的运行效果来看,预约挂号的放号量和使用率都不高。而且存在一些问题,如上办事大厅虽然有统一接入平台,但是预约挂号的提示不明确,医院出诊表不统一,存在各式各样现象,人机交互程度较差,群众使用起来极为不便等问题,有些还是单一PC端网站预约挂号平台,这些平台已难以满足患者的需求。随着移动互联网技术已经突飞猛进发展,预约
生物特征识别技术是最有效的个人身份认证解决方案之一。随着生物特征识别技术的广泛应用,生物特征识别数据库的规模不断扩大。在这种情况下,快速匹配和检索技术越来越有必要。掌纹识别技术是近年来新兴的生物识别技术之一。在掌纹识别技术中,有多个子类别,包括低分辨率掌纹识别和三维掌纹识别技术等。研究者们已经提出许多掌纹识别算法。而对快速的掌纹检索的算法研究还处于起步阶段。哈希技术是最流行的图像检索技术之一,由于
随着科技的发展和公共安防需求的增加,智能监控系统的部署成为了一种流行趋势,其核心是行人再识别技术。本文首先简要介绍了行人再识别研究的意义、现状、挑战;接着深入研究行人再识别的理论知识,概述了行人再识别发展至今的经典算法;然后针对行人图片错位、遮挡、无关信息干扰等问题,对融合全局特征与局部特征的行人再识别算法进行研究,以上述两种类型特征的有效提取方法为切入点,做了以下研究工作和算法创新。第一个工作是
光场相机通过对单个场景进行多视角密集采样,使得高精度深度信息的挖掘成为可能,在深度传感器中不论在便携性还是深度精确性方面都具有显著优势。现有的深度估计方法不能很好处理遮挡和噪声问题,特别是对于包含遮挡区域的噪声场景,遮挡和噪声的同时存在将使深度获取难度进一步加大。本文分别围绕遮挡和噪声这两大难点问题对光场深度估计展开研究。论文的主要研究工作如下:(1)概述光场深度估计原理以及国内外的应用场景和研究
水下图像是获得水下场景信息的重要媒介之一,在水下探测、海洋研究等领域都扮演着重要角色。然而,光在水下传播时会与水体产生强烈的吸收与散射作用,导致水下成像质量下降,严重限制了水下的可视范围。因此,水下成像及复原技术在水下救援、海洋探索以及海洋目标识别等领域都有着重大意义和实际价值。本文首先针对水下图像中散射光去除的问题,采用分层思想分离图像中的散射光,实现了水下图像复原,提高了水下图像的质量;其次针
大数据时代,人们日常生活中处处都在积累着数据,从而导致大量的数据在不停的堆积,这些数据的内在价值是让很多学者们去研究聚类算法的动力。聚类算法的出现,使得巨大的数据得以发挥背后隐藏的价值。聚类有效性指标是对聚类结果进行评价,对于发现正确聚类数起到关键性的作用,然后现有指标存在簇中心分布很接近时难以得到正确聚类数、分离性处理机制过于简单、面向含噪声的数据集效果较差的问题。为此,本研究面向模糊聚类提出了
随着智能化信息时代的到来,校园学生对于获取信息的高效性也越来越重视。目前高校学生获取各类信息需要在不同的App和平台上进行,这对高校学生获取信息造成一定的局限性。在信息爆炸的时代,快速找到自己有用的信息对提高生活品质也显得必不可少。为此,需要搭建基于个性化推荐的、集失物招领、交友、经验交流、买卖交易为一体的校园学生互动管理平台。本平台采用个性化的推荐算法,为每一位学生提供个性化的服务,从而让用户快