论文部分内容阅读
随着我国货运需求量的增大,铁路货运成为铁路运输的主要成分。原有的货检作业主要依靠人工巡检,作业方式陈旧落后、耗时耗力,不再符合货运管理的现代化要求。实现货检作业自动化,是铁路安全监控与管理系统建设的关键环节,而实现货运列车车号的定位与识别是货检作业自动化的基础环节。货运列车车号(约400*80像素)在整幅输入图像(约8375*2048像素)中占据很小的面积,并且存在大量非车号的干扰文本,另外受环境、背景、光照、车型车种等因素的影响,给货运列车车号定位带来很大挑战。由于车号间隔不定,车号字符断裂、粘连与缺失,导致货运列车车号识别难度大。本文提出采用基于视觉图像处理技术结合场景文本识别技术的方法实现货运列车车号的定位与识别。本文主要工作内容如下:(1)在货运列车车号的定位阶段,提出一种两阶段的货运列车车号的定位方法。第一阶段为减小车号间隔大的复杂车号数据的漏检率,采用改进场景目标检测的深度学习方法进行车号检测。第二阶段将候选车号区域进行后处理,并利用“方向梯度直方图+支持向量机”的技术实现候选车号区域的二次筛选。我们收集并标注了难、易两类各4500幅车厢全景图进行测试分析。实验结果相对于原检测方法提高了近10%,达到了90%的定位精确率,每幅车厢全景图仅需0.3s的处理时间。(2)在货运列车车号的识别阶段,研究了两种车号识别算法。首先提出一种先分割后识别的方法,为有效解决了车号字符的断裂与粘连,提出一种动态窗口分割算法将车号区域分割成独立的字符,然后利用支持向量机识别车号。另外也采用一种基于深度学习的方法进行车号序列的端到端识别。首先利用卷积神经网络提取图像特征,循环神经网络学习车号序列特征,最后通过连接时序分类转换为最终的车号识别结果。我们标注2000幅测试图像并对两种识别方法进行对比分析,动态窗口分割更符合宽度不均匀且内部断裂的车号字符;基于深度学习的货运列车车号识别避免错误传递,达到了 91%的准确率,每幅车号图像0.04s的识别速度。(3)在我们搭建的货运列车车号识别系统中,为充分利用实验数据,提出一种多角度融合算法提高系统识别率。融合算法包括定位与识别结果融合,将不同角度定位、识别结果融合为唯一结果。我们在3000幅车号图像上定量分析了多阶段和两阶段的货运列车车号系统识别。实验发现,两阶段的货运列车车号系统识别准确率达到了91%,融合策略将系统识别准确率提高了至少3%。