基于深度学习的超市商品图像识别方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:chenyong198966
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,越来越多的场景都逐渐实现了自动化或半自动化。新零售的背景下,自动化零售近年来也受到了广泛的关注。传统的识别方法有条码识别和RFID射频识别。然而条码识别需要人工辅助,自动化程度低。RFID由于布置成本高,没有普及开来。通过人工智能技术和计算机视觉方法,自动化地识别顾客购买的商品,成为重要的研究课题。如何在非限制条件下,对可旋转、多视角、少量数据标注的商品识别是目前研究的重点和难点。本文针对超市商品图像识别问题,其主要工作内容如下:1.对于单个商品的识别,在实际场景下,图像包含大范围的背景且没有商品位置的标注;而且数据采集消耗成本大,训练图像仅有少量训练样本;此外,与通用物体识别不同,商品对象角度是不确定的,识别的难度更大。本文针此问题,提出了一种候选区域标注算法,仅需要公开数据集训练,即可对商品图像生成有误差的预标注。同时结合增强样本方法,生成不同角度的样本,并通过迁移学习对商品识别进行再训练,使模型具有旋转不变性,实现商品的识别。实验结果表明,通过所提出的候选区域标注算法,使得商品识别达到了 86.6%的top-1准确率和94.34%的top-3准确率。2.在仅有单个商品训练图像,且没有商品位置标注的情况,对于多个商品检测任务,需要完成多个商品的定位以及多个商品的识别任务。本文针对此问题,首先对FasterRCNN的边框回归层进行改进,提出了一种非类别特异性的边框回归层,仅使用公开数据集训练,无需在目标数据集上进行再训练,并将其用于数据预标定与商品定位。然后结合Grabcut与非类别特异性Faster RCNN,提出了一种样本增强方法,用来合成大量包含多个商品的训练图像,并用于模型训练。此外基于非类别特异性Faster RCNN提出了重识别层,提高了检测精度。最终,多个商品的识别与定位效果,达到了 93.8%的召回率和96.3%的精度。3.结合上述方法,设计并实现了超市商品图像识别验证系统,对所提出的算法进行验证测试。
其他文献
激光诱导击穿光谱技术(LIBS)是一种原子发射光谱检测技术,该技术利用高能脉冲激光聚焦于样品表面,烧蚀样品产生等离子体,等离子体在演化过程中发射对应元素光谱,利用谱线可以对元
本文以甘肃工大舞台技术工程有限公司为背景,针对当前舞台机械监控系统存在的主要问题:第一、基于二维组态技术,人机监控界面交互性差、动画呆板;第二、利用编程语言开发的监控
据世界卫生组织所示,心血管疾病是当今世界上导致死亡率最高的一种疾病。长期以来,对心血管疾病的研究一直是学术界的一个非常重要的课题。心电信号作为心脏电活动在体表的综
针对目前电池供电的无线传感器网络节点能量受限和使用寿命不长的问题,本文基于电磁耦合谐振理论,设计了一种双天线结构的无线传感器网络节点。其中采用射频识别技术实现对无线
聚类作为一种重要的数据分析手段,是机器学习、模式识别等领域的研究热点。聚类的目的是把对象按照性质上的亲疏程度分成多个类或簇,使得簇内的数据具有较高相似度,簇间的数据具
回转库是一种对档案、图书、工具和枪支等物件进行数字化管理、具有更好保密能力的新型自动化仓储系统,近年来在部队、武警、消防和法院等系统开始得到推广应用。本文以此为
无刷直流电机(BLDCM)具有结构简单、效率高,运行可靠等优点。然而有位置传感器的BLDCM故障率高且维护困难,直接限制了其推广应用,因此开发无传感器的BLDCM控制技术是未来的发展方
动态天气图像复原是一项极富挑战的研究内容。雨雪等频繁的恶劣天气使视频图像严重退化,降低了图像的价值,严重影响了视觉系统的性能。雨天气对目标检测,跟踪等的影响同样不容忽
本文首先对数字减影血管造影序列进行血管增强,然后对血管增强的序列图像应用彩色编码血管成像技术,使灰度图像序列中包含的血流信息显示在单幅彩色图像中。经过以上改进,医生可
机器人相互协调工作在军用和民用方面都有很多优点,近年来,多移动机器人协调合作成了研究学者广泛研究的内容之一。编队是机器人之间可以协作的一个主要问题。机器人编队是一