论文部分内容阅读
随着科学技术的发展,越来越多的场景都逐渐实现了自动化或半自动化。新零售的背景下,自动化零售近年来也受到了广泛的关注。传统的识别方法有条码识别和RFID射频识别。然而条码识别需要人工辅助,自动化程度低。RFID由于布置成本高,没有普及开来。通过人工智能技术和计算机视觉方法,自动化地识别顾客购买的商品,成为重要的研究课题。如何在非限制条件下,对可旋转、多视角、少量数据标注的商品识别是目前研究的重点和难点。本文针对超市商品图像识别问题,其主要工作内容如下:1.对于单个商品的识别,在实际场景下,图像包含大范围的背景且没有商品位置的标注;而且数据采集消耗成本大,训练图像仅有少量训练样本;此外,与通用物体识别不同,商品对象角度是不确定的,识别的难度更大。本文针此问题,提出了一种候选区域标注算法,仅需要公开数据集训练,即可对商品图像生成有误差的预标注。同时结合增强样本方法,生成不同角度的样本,并通过迁移学习对商品识别进行再训练,使模型具有旋转不变性,实现商品的识别。实验结果表明,通过所提出的候选区域标注算法,使得商品识别达到了 86.6%的top-1准确率和94.34%的top-3准确率。2.在仅有单个商品训练图像,且没有商品位置标注的情况,对于多个商品检测任务,需要完成多个商品的定位以及多个商品的识别任务。本文针对此问题,首先对FasterRCNN的边框回归层进行改进,提出了一种非类别特异性的边框回归层,仅使用公开数据集训练,无需在目标数据集上进行再训练,并将其用于数据预标定与商品定位。然后结合Grabcut与非类别特异性Faster RCNN,提出了一种样本增强方法,用来合成大量包含多个商品的训练图像,并用于模型训练。此外基于非类别特异性Faster RCNN提出了重识别层,提高了检测精度。最终,多个商品的识别与定位效果,达到了 93.8%的召回率和96.3%的精度。3.结合上述方法,设计并实现了超市商品图像识别验证系统,对所提出的算法进行验证测试。