自然场景文字检测与识别研究

来源 :石家庄铁道大学 | 被引量 : 2次 | 上传用户:wangxiaoxiao880523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然环境中文字随处可见,人们通过文字可以进行信息传递和交流。由于场景文字包含了重要的语义信息,因此能够准确检测和识别场景文字信息至关重要。场景文字检测和识别技术对智能交通系统、无人驾驶等领域具有重要的应用,尤其是智能交通系统。在中国经济飞速发展的当下,民众的生活水平均得到了提升,汽车拥有数量也大幅上涨,使得交通系统拥堵现象严重。场景标识文字检测技术作为智能交通系统的一部分,本文以交通标志牌的文字识别为背景,研究自然场景的文字检测和识别技术。主要工作如下:(1)分析了传统的场景文字识别技术OCR,指出OCR识别系统在场景文字识别中存在的不足之处;对深度学习的相关理论进行了描述,并对本文使用的深度学习框架进行了研究;分析了场景文字检测数据集并且制作了交通标志文字数据集。(2)对基于颜色和形状的交通标志牌中文字的检测和识别技术进行了分析和实现,将颜色和形状进行特征融合,并利用K-means颜色聚类算法实现图像分割,然后通过连通域分析法对文字进行检测,最后利用OCR识别系统对文字进行识别。(3)分析了深度学习Faster R-CNN算法,然后对Mask R-CNN算法进行了研究,采用基于Mask R-CNN的方法的场景文字检测模型,利用Mask R-CNN的文字检测网络模型对数据集进行训练,得到场景文字检测模型,并在数据集上进行训练和验证,实验结果证明本文的网络模型可对场景文字准确检测。(4)针对场景文字识别技术,本文使用编码器-解码器的思想,使用CNN和BiLSTM对场景文字进行编码,然后利用Attention机制和CTC相结合的方法进行解码,完成对场景文字的识别。最后进行实验对比,证明该方法的有效性。
其他文献
目的观察基于预测性姿势调整(APA)的抛接球训练对慢性脑卒中患者下肢运动功能的影响。方法住院慢性脑卒中患者41例随机分为试验组(21例)和对照组(20例),两组均接受常规物理治
采用问卷调查方式,对福建省5所高职院校药学专业1000个学生进行问卷调查,以了解高职药学专业学生在线学习情况,提出高职药学专业学生在线课程建设及在线学习管理的建议,以期
本文在对我国工程项目管理的发展趋势进行总结的基础上,介绍了大型工程项目在管理中的前沿应用——项目信息门户,并对PIP的应用特点、功能进行分析。
近几年,每到清明前后,总有一则消息出现在媒体上,称“清明蔗,毒过蛇”。当然,这是民间说法,清明前后,由于气候潮湿,尤其是南方,食物容易发生霉变。霉变的甘蔗切开后,里面有红色丝状物,其
报纸
目的建立了乳粉加水和曲拉通溶解,利用石墨炉原子吸收光谱法直接测定铬的检测方法。方法采用NH4H2PO4作基体改进剂,降低原子化温度,解决拖尾现象;在石墨炉升温过程中采用分步
田间道路识别是农业机械在田间道路上自动行驶的基础.针对丘陵山区田间道路复杂多变、无车道线和无明显边界等特点,提出一种基于机器视觉的道路虚拟中线提取算法.首先将道路R
[目的/意义]了解和比较中美一流大学图书馆移动服务的发展情况,有利于更好地促进中国大学图书馆移动服务的提升。[方法/过程]采用网站访问调查和内容分析的方法,对中国137所"
为了揭示内蒙古葱属野生种表型遗传多样性,采用方差分析、主成分分析、聚类分析等方法,对收集的78份野生种的种质资源14个表型性状进行了遗传多样性评价。结果表明:内蒙古葱
郭象玄学的主要目的是想把阮籍、嵇康和裴"各执一偏"的"自然"与"名教"重新统合起来,构建一套适合时代要求的政治哲学。郭象的政治哲学以其对人性的思考为运思起点,而从圣凡关系、君
提出了一种自适应模糊控制算法的防滑刹车系统设计方案,并在DSP和CPLD硬件上实现了这种智能算法。结果表明:采用自适应模糊控制算法在改善飞机刹车性能和提高刹车效率方面有