论文部分内容阅读
汉字是世界上使用最多的文字,汉字识别在残疾人无障碍阅读、文献自动录入、邮件分拣、银行票据处理、证件识别等领域有着重要的应用价值。汉字数量巨大,手写风格各异,并且汉字中存在大量的形近字,导致脱机手写汉字识别一直存在准确率偏低的问题。近年来,深度学习发展迅速,在模式识别、自然语言处理、语音识别等领域都取得了不错的成绩。因此,本文采用深度学习的方法对脱机手写汉字识别进行研究。
针对汉字识别大分类问题,采用深度学习中卷积神经网络的方法对GB2312-80标准中规定的最常用的一级3755个汉字进行识别。典型的卷积神经网络是一个端到端的结构,直接接受原图输入,但却无法学习到相关领域知识。常规卷积操作中,图像对应区域的所有通道均被同时考虑,无形中增加了网络的冗余度。本文对此进行改进,使用图像的八方向梯度特征作为卷积神经网络输入,使用深度可分离的卷积方式进行卷积。最后设计多组卷积神经网络进行实验,在CASIA-HWDB数据集上的实验结果表明,八方向梯度特征输入与深度可分离卷积能够显著提升汉字识别效果,最终取得了95.86%的准确率。
针对脱机手写汉字识别中形近字难以识别问题,从两个方面进行改进。方法一,使用卷积神经网络加中心损失的方法对相似手写汉字进行识别。引入度量学习中中心损失函数到卷积神经网络,使用交叉熵损失及中心损失作为卷积神经网络的联合损失,使模型学习到更加具有鉴别能力的特征,减小同类样本之间的距离,增加不同类样本之间的距离。方法二,使用卷积神经网络加支持向量机的方式对相似手写汉字进行识别。将卷积神经网络当作一个特征提取器,使用卷积神经网络全连接层输出的特征向量训练支持向量机分类器,识别相似手写汉字。实验结果表明,使用联合损失函数的方法,及卷积神经网络加支持向量机的方式相对于单独使用卷积神经网络的方式,平均识别准确率能够提升2.68%,1.59%。
针对汉字识别大分类问题,采用深度学习中卷积神经网络的方法对GB2312-80标准中规定的最常用的一级3755个汉字进行识别。典型的卷积神经网络是一个端到端的结构,直接接受原图输入,但却无法学习到相关领域知识。常规卷积操作中,图像对应区域的所有通道均被同时考虑,无形中增加了网络的冗余度。本文对此进行改进,使用图像的八方向梯度特征作为卷积神经网络输入,使用深度可分离的卷积方式进行卷积。最后设计多组卷积神经网络进行实验,在CASIA-HWDB数据集上的实验结果表明,八方向梯度特征输入与深度可分离卷积能够显著提升汉字识别效果,最终取得了95.86%的准确率。
针对脱机手写汉字识别中形近字难以识别问题,从两个方面进行改进。方法一,使用卷积神经网络加中心损失的方法对相似手写汉字进行识别。引入度量学习中中心损失函数到卷积神经网络,使用交叉熵损失及中心损失作为卷积神经网络的联合损失,使模型学习到更加具有鉴别能力的特征,减小同类样本之间的距离,增加不同类样本之间的距离。方法二,使用卷积神经网络加支持向量机的方式对相似手写汉字进行识别。将卷积神经网络当作一个特征提取器,使用卷积神经网络全连接层输出的特征向量训练支持向量机分类器,识别相似手写汉字。实验结果表明,使用联合损失函数的方法,及卷积神经网络加支持向量机的方式相对于单独使用卷积神经网络的方式,平均识别准确率能够提升2.68%,1.59%。