论文部分内容阅读
随着人工智能技术的发展与社会应用需求的增加,越来越多的场景中使用到了目标检测技术。目标检测识别技术使用机器代替了人工在复杂场景下的目标检索与识别,在节省人力的同时增加了检索与识别的准确度,提高了工作的效率。目前,目标检测应用大都是构建在传统的PC机器或者是搭载GPU的异构机器上,此类目标检测应用存在着成本高、能耗高、可重构性差等缺点。因FPGA具有计算并行度高、配置灵活、功耗低等优势,本文将理论与实践相结合,使用深度学习目标检测中的yolov3-tiny算法,实现了FPGA平台下的高性能目标检测,同时结合yolov3-tiny算法存在的检测精度较低与FPGA片上存储资源紧缺的特点,对算法模型进行了改进优化。本文对模型的优化内容主要包括以下几个方面:针对模型检测精度较低的问题,提出了一种对模型结构进行改进的方法来提升模型提取特征的能力;针对模型体积大于FPGA片上存储空间的问题,使用通道剪枝的方式对模型进行裁剪来减少模型的体积;针对FPGA处理浮点数能力较弱的问题,对模型进行int8量化来提升模型在FPGA下的检测速度。本文通过对比实验对模型优化的效果进行了验证,实验结果表明,对模型结构的改进能有效的提升模型检测的精度;对模型的剪枝在模型精度几乎无损伤的情况下使模型大小降低到原先的百分之四十;对模型的量化使模型在FPGA平台下的检测速度大幅提高,检测速度几乎与GPU平台下相同。最后,根据实际的项目需求且区别与其他产品中使用GPU作为算法的加速器,本文使用基于FPGA的异构平台和本文改进优化完成的目标检测模型,设计实现了监狱管理系统中的实时自动点名功能模块,进一步证明了本文对算法模型优化的有效性。