基于arm移动端的实时目标检测研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wanghua8503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络的在各个领域的成功应用,在计算力和内存资源有限的移动设备上运行卷积神经网络模型的需求也越来越大,因此需要发展高效模型以及针对移动设备优化的高性能神经网络前向计算框架。本文针对卷积神经网络应用于移动设备存在的问题,结合了软硬件的优化方案,包括通过采用改进的轻量级网络模型以及对部分算子进行手工NEON汇编优化指定向量寄存器运行计算,在低成本嵌入式移动设备上(如树莓派、RK3399和安卓移动设备)实现了实时目标检测、文本检测和文本识别;在硬件层面,采用NCNN前向推理框架运行,对于全连接层算子,手工优化ARM NEON汇编指令,指定向量寄存器进行乘加法计算,多线程运行方案。具体研究内容和结论如下:目标检测采用改进one-stage的SSD(Single Shot MultiBox Detector)算法,将原算法中的VGG16特征提取网络算法替换成轻量级MobileNetV3Large算法。改进的目标检测算法在Caffe和Pytorch深度学习框架平台上训练后,经过NCNN前向推理框架转换后,融合BN,Scale和ReLU算子后的模型参数大小为10M。当输入300×300像素的图片时,在小米9安卓设备上目标检测速度为42ms。文本检测采用改进的AdvancedEAST算法,同样将VGG16特征提取网络算法替换成MobileNetV3Large算法,改进后的文本检测算法在Caffe和Pytorch框架平台上训练后,经过NCNN前向推理框架转换后,融合BN,Scale和ReLU算子后的模型参数大小为8.2M,在小米9安卓设备上单帧运行速度为29ms。文本识别采用改进的CRNN算法,将backbone特征提取网络替换为部分MobileNetV3Large算法,改进后输入维度为32×128像素的图片,输出为4×16的特征图结构。将生成的Caffe模型经过NCNN前向推理框架转换后,带LSTM层的模型参数大小为10M左右,不带LSTM层的模型参数大小仅2.8M。通过手工NEON汇编优化GEMM矩阵算法,指定寄存器进行乘加运算,不带LSTM层的模型在32位系统树莓派3设备上,单帧识别10个字符的速度为37ms,在64位系统RK3399设备上速度为27ms,小米9安卓设备上速度为12ms。通过软硬件的优化后的目标检测、文本检测以及文本识别方面在移动设备上基本达到了实时运行的效果,这样可以极大的节约了成本,并且在保证识别精度下,能够满足实际应用的需求。
其他文献
在当代电子信息技术和互联网高速发展的时代背景下,扁平化设计风格显露生机,并于短时间内在全球范围内普及,深受年轻受众的喜爱。扁平化插画是扁平化设计与插画艺术结合的产物,作为符合时代审美的新兴艺术形式,本文试图将其与茶包装设计结合,形成传统产品与现代艺术的碰撞。本文共由五个章节构成:第一章,主要论述了茶包装设计中应用扁平化插画的时代背景和国内外研究现状,阐明了课题研究的目的意义与研究方法;第二章,对扁
基于Internet的网络阅览室就是通过计算机联网,使读者可以上Internet获取所有网上信息的阅览室.它既可以在已建立的局域网上实现,又可以直接通过Internet进行.网络阅览室能突
随着温州金融综合改革试验区获批之后,A股市场掀起一波又一波的“炒地图”行情。
本文阐述了在网络环境下如何开展信息服务工作,特别强调高校图书馆要根据自己的专业特点,搞有特色的信息服务,建立完善的网络信息资源以保证信息服务的质量.
可信计算是在计算和通信系统中广泛使用基于硬件安全模块支持下的可信计算平台。通过分析可信计算的产生背景、发展历史以及可信计算原理和在我国的发展现状,呼唤人们强化信息
第三腰椎横突综合征是腰痛或腰腿痛病中常见一种,尤以青壮年为多。运用中西药或针灸推拿治疗往往是见效慢,疗效欠佳。本人自1997年起用小针刀治疗本病,现报道如下。
如今科技、经济高速发展,生活中充斥着各种各样的诱惑,大学生作为社会主义的建设者和接班人,其道德素养是我国高校人才培养中一大重点。根据习近平总书记在全国高校思想政治