基于深度学习的文字识别算法研究

来源 :山西师范大学 | 被引量 : 0次 | 上传用户:songxin_gkong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别问题的难点在于以下两点,第一是文字的存在形态千变万化,尤其是汉字更是笔画多样,有各种字体等;第二是文字在实际应用场景中可能存在被遮挡、背景复杂等多种情况,因此做好文字识别算法涉及两个关键技术:第一需要提取出具有良好表征性的文字特征以及有效的分类决策网络;第二需要设计出合理的数据增强算法,对训练样本进行接近现实中各种情况的图像变换,以此学习出更加稳健的识别模型。本文基于CRNN模型设计了一种文字识别模型,成功地实现了对各种字符进行高准确率的识别。本文的主要工作包含以下三个部分:第一是数据增强算法的设计。本文设计了合适的数据增强算法,帮助网络更好的学习。第二是特征提取网络的设计。本文在CRNN模型的基础上对其特征提取网络进行改进,通过利用Dense-Block结构设计出来的特征提取网络不仅可以更好的提取样本特征信息,还可以学习到文字中的上下文信息。第三是网络决策层的设计。本文利用一个卷积层替换掉了原始CRNN模型中参数量大、不易收敛的LSTM层。这样做不仅一定程度上提高了识别率,而且减少了网络参数、加快了网络收敛速度。本文利用Python语言以及Keras框架编程实现整个文字识别系统,其中包括数据增强算法、特征提取网络以及网络的决策层等。实验结果表明,该系统能够很好识别出各种字符,识别精度高。其在汉字数据库上识别率为95.28%,英文字符数据库上的识别率96.47%,数字数据库上的识别率为98.85%。
其他文献
电子回旋辐射成像诊断是基于测量nw量级的等离子体自由电子回旋辐射信号进而提供托卡马克电子温度及其涨落的极向剖面分布的先进微波诊断,已为国内外主要的托卡马克装置所采
以上海市普陀区真如副中心A5地块南区三期超高层塔楼超厚基础底板超高强度大体积混凝土施工为背景,分析了该工程大体积混凝土浇筑的特点、难点;并通过周密的施工组织部署、混
本文主要介绍了当今流行的几种计算机病毒及其危害,并对如何防治提出了可行有效的方法.
采用ZYGO MarkⅢ-GPI数字波面干涉仪、NamoScopeⅢa型原子力显微镜对不同氧分压下电子束蒸发方法制备的SiO2薄膜中的残余应力及表面形貌进行了研究,结果发现:随着氧分压的增
太阳能LED路灯实现高效率的绿色能源转换,满足照明需要,是“绿色能源”;可见光通信在通信中无电磁辐射,是“绿色通信”。本文将太阳能路灯和可见光通信结合起来,实现同时具有“绿色能源”和“绿色通信”的“纯绿色”系统。针对太阳能LED路灯系统,本文首先对路灯系统的核心部件——智能控制器进行了硬件和软件设计,实现了一个手机APP远程控制的路灯可见光通信系统硬件平台。在太阳能LED路灯上加上可见光通信电路,
0引言进口X线设备的系统盘是设备的大脑,主要用来协调指挥设备各个部件的时序动作。患者的检查离不开医疗设备的正常运行,一旦系统崩溃后,常规是联系厂家,等工程师到医院,重