【摘 要】
:
自2012年AlexNet在ILSVRC竞赛夺冠以来,基于神经网络的算法已经取代了传统算法在计算机视觉领域的统治地位。目标检测作为计算机视觉领域的重要研究方向,近年来取得巨大进步,而人脸检测和文本检测作为目标检测领域的重要方向,也成为研究热点。随着近十年来移动互联网的兴起和硬件性能的提升,移动端成为日益重要的算法部署平台。然而,基于神经网络的人脸检测和文本检测在移动端的部署仍处于起步阶段,且存在模
论文部分内容阅读
自2012年AlexNet在ILSVRC竞赛夺冠以来,基于神经网络的算法已经取代了传统算法在计算机视觉领域的统治地位。目标检测作为计算机视觉领域的重要研究方向,近年来取得巨大进步,而人脸检测和文本检测作为目标检测领域的重要方向,也成为研究热点。随着近十年来移动互联网的兴起和硬件性能的提升,移动端成为日益重要的算法部署平台。然而,基于神经网络的人脸检测和文本检测在移动端的部署仍处于起步阶段,且存在模型占存储空间过大、推理延迟过长两大难点,极大制约了目标检测在移动端的应用。针对以上难点,本文改进了目标检测模型的结构,通过对模型进行剪枝、层融合、量化等一系列优化,在保证检测精度的同时显著降低了模型的计算量,实现了目标检测算法在安卓端的部署与应用。取得的主要研究成果和创新点包括:(1)人脸检测方面,在MTCNN的基础上,引入深度可分离卷积,构建轻量化的人脸检测网络FaceModel,该模型较MTCNN计算量缩减了 70%以上,在FDDB人脸检测数据集上的检测精度仅降低0.4%;文本检测方面,在Pixellink的基础上,引入MobileNet-v2作为其特征提取分支,构建轻量化的文本检测网络OCRModel,该模型较Pixellink+VGG计算量缩减了 98%,在自建名片数据集上的检测精度仅降低1.1%。同时,针对训练样本不平衡问题,在构建的两个轻量级网络中引入Focal Loss损失函数,有效提高了网络的收敛能力。(2)在 Tensorflow 框架下,对提出的 FaceModel 和 OCRModel从网络结构和存储空间两个方面完成进一步的优化。在网络结构部分,通过剪枝和层融合进一步压缩模型的结构,压缩后的FaceModel参数量缩减了 77%,检测精度仅降低2%;压缩后的OCRModel参数量缩减了 90%,检测精度仅降低1%。在存储空间部分,采用非对称分通道量化再训练的方式,实现了 32位浮点模型向8位定点模型的转换。(3)完成安卓端离线目标检测应用程序的设计和开发。人脸检测模型和文本检测模型共计1.1MB,人脸检测速度达到50FPS,文本检测加识别总延迟小于1秒。测试结果表明,提出的FaceModel和OCRModel实现了检测准确性和实时性的平衡,在存储空间和推理延迟方面满足了移动端部署的要求。
其他文献
由于光纤传感器在医学、食品安全、生化和环境监测中具有广泛的应用前景,近年来,国内外科研团队在光纤传感的研究上投入了大量的精力,也产出了丰厚的科研成果。光纤传感器由于具有结构紧凑、重量轻、电绝缘性能好、耐高温、耐腐蚀等优秀的固有条件,在许多实际应用场景中比传统的电传感器体现出明显的优越性。而且,光纤的原材料硅资源丰富,造价低廉。随着光纤制作工艺越来越先进,多种类型的光纤可以满足科研人员对光纤传感器的
网络舆情是指在网络用户对热门话题或者某些实时新闻持有的不同看法以及发布的网络评论的总和。如今,无论是在社交平台还是新闻网站,每天都会产生海量的舆论信息,但是由于网络监管较为宽松,越来越多的人会在网络的各个平台上任意的发表自己的想法,其中某些极性的语言容易引导错误的舆情方向。因此需要一种高效的文本倾向分析方法来处理网络上海量的信息,并及时的发出舆情预警,这对营造良好的网络舆情环境,保证我国网络舆情环
中国特色社会主义法治建设进入新时代,地方性法规规章翻译是我国话语体系走向世界的重要手段,有助于增强国家文化软实力和中华法律文化国际影响力。在此背景下,本项目报告以
偏二甲肼污水处理是世界性难题,尤其在航天发射场,污水量很大,目前有很多处理方法见诸文献报道,但都没能应用到实际中,NASA和俄罗斯航天局用焚烧和自然分解法处理。本论文用
目前,化工行业得到前所未有的发展,化工企业的工程建设规模也越来越大。化工行业所使用的物质,大多都是易燃易爆、有毒或腐蚀性的危险化学品,这种产品的性质可能导致严重的后果,如果工程建设过程中质量不过关,其后果是不可想象的。所以,化工工程项目的建设就要从根本上严格把握工程建设的质量。而在进行工程建设过程当中,焊接是最重要的工艺技术,焊接工作也是整体质量最难管理和最薄弱的要点之一,因此,焊接质量过程管理工
夸克-胶子等离子体(QGP)是格点QCD预言存在的一种新物质,物理学者们普遍认为高能重离子碰撞后的短暂时期与宇宙早期可能存在着QGP。目前的实验精度还无法直接测量到QGP物质,实验上可以观测到的是末态粒子,对于碰撞后的中间过程是也只能依靠各种唯象模型来推演。在高能重离子碰撞所形成的高温高密媒介系统中,QCD预言产生的QGP物质会随着致密系统源的膨胀而产生相变-即强子化。继强子化后,利用波戈留波夫变
目前,PPP(Public-Private Partnership)模式作为我国供给侧结构性改革、基础设施补短板的重要组成部分,正在发挥积极的牵引作用。中国已成为全球规模最大、最具影响力的PPP市场,但落地难、再融资难等问题持续制约着PPP健康发展。PPP项目建设过程中,融资是“投、融、管、退”四个环节中关键的一环,融资方案的合理性和融资行为的规范性是PPP项目成功的重要保障。可融资性可以理解为“
触觉传感是视觉传感之外另一项重要的传感技术。在过去的50年间,研究人员尝试使用各种技术来开发小型、可靠、敏感的触觉传感器。由于大部分触觉传感器受电流或电压驱动,普遍存在着排线复杂、零点漂移、易受电磁干扰等缺陷。因此在一些复杂环境中如极端温度、强辐射等,这些传感器往往难以正常工作。而布拉格光纤光栅(FBG,Fiber Bragg Grating)作为一种典型的光纤传感器可以有效避免上述问题。因此本文
在面对高速变化的市场经济环境时,企业从前所形成静态均衡的局势逐渐失去,在稳态环境中拥有的优势和市场份额也被逐渐侵蚀,企业的核心能力有可能演变为核心刚性,其拥有的资源和能力不再匹配变化的市场环境。越来越多的学者认为动态能力是提高企业绩效、赢得竞争优势的关键。但是,以往的研究学者们大多从组织层面出发对动态能力进行研究。尽管很多管理学者已经认识到多层次研究的重要性。同时,企业战略定位作为公司决策机制的重
当今,全球变暖已愈发成为一项严峻的环境变化问题,日益剧烈的人类活动影响水体环境中的碳氮元素平衡,导致CO_2、CH_4、N_2O气体在表层水体中普遍处于过饱和状态,使得水体生态系统成为温室气体的重要排放源。因此,本研究以天目湖地区的中田舍河流域为例,选取不同水体类型代表性样点,运用多种温室气体排放监测方法,于2019年通过以月次为单位、为期一年的实地温室气体排放监测活动,分析中田舍河流域温室气体的