论文部分内容阅读
随着社会经济发展和人民生活水平的不断提高,党和政府越来越重视食品、药品的安全问题。生产日期作为食品、药品安全的重要参考标准,已经成为人们选择购买商品时的必要检查对象。喷印因其成本较低、操作简便,已成为食品、药品包装企业普遍使用的一种生产日期标注方法。为了检测喷码机喷印的生产日期等信息的正确性,本文构建了一个喷码字符识别系统的实验平台,并设计了利于人机交互的喷码字符识别界面。构建的平台包括:硬件系统、MV_View、HALCON、PyCharm和PyQt5。利用构建的平台对喷码字符的识别方法进行了研究,改进了喷码字符的识别技术,实现了端到端不分割的喷码字符识别。本文完成的主要研究工作如下:1.喷码字符识别系统的实验平台设计。实验平台由硬件系统和软件系统组成,其中硬件系统包括:光源、工业相机、镜头、机电一体化传送装置和外触发装置,软件系统包括图像采集模块和图像处理模块。图像采集模块包括格式控制、采集控制、数字I/O控制和连续存图插件;图像处理模块包括读取图像模块、图像预处理模块、字符分割模块和字符识别模块。2.基于HALCON12.0的喷码字符识别方法研究。本实验研究了一种基于连通域分割和等间隔分割的单一字符图像分割方法,并使用支持向量机SVM(Support Vector Machine)对HALCON OCR(Optical Character Recognition)模型进行训练。本实验的数据集为150张含有喷码字符区域的乳制品包装盒图像,使用其中的100张图像对HALCON OCR模型进行训练,并用训练好的模型对另外50张图像进行离线测试,识别的准确率达到98%,识别一张图像的平均时间为0.25s。3.基于TensorFlow的喷码字符识别方法研究。在对传统的机器学习方法进行研究后,使用TensorFlow框架,搭建了一个卷积神经网络CNN(Convolutional Neural Network)模型,实现了端到端不分割的喷码字符日期码识别。本实验使用的数据集为自制集,通过读取3650张样本图像对卷积神经网络进行训练,同时加入了随机膨胀、腐蚀算法以提高系统的鲁棒性。使用训练好的模型对样本集外的365张图像进行离线测试,正确识别363张,准确率达到99.45%,平均识别1张字符图像的时间为25.2ms。4.基于PyQt5平台的喷码字符识别界面设计。为了更加直观的感受图像处理中各步骤所起到的作用,本文通过配置计算机视觉库python-opencv和GUI开发平台PyQt5,在PyCharm软件中设计了一种基于PyQt5平台的喷码字符识别界面。该界面的设计采用模块化思想,分为读取图像模块、图像预处理模块、图像分割模块和图像识别模块。在图像预处理模块中,提供了两种图像增强方法、两种阈值分割方法和两种基础的形态学操作供用户选择,并通过模板匹配的方法对喷码字符图像进行识别,取得了较好的效果,表明了所设计的喷码字符识别界面可以完成喷码字符的识别工作。