论文部分内容阅读
随着信息技术的日益成熟,各个领域电子化的趋势越来越明显,在频繁的人机交互中,高效、流畅、自然的交互方式会为用户带来良好的体验。手写录入作为人机交互中的重要组成部分,因其学习成本低、录入方式自然、造成歧义少、视线可以脱离录入设备等优势,在特定人群和车载导航等领域有着广泛的应用,因此对识别精度的要求也越来越高。近年来计算成本和存储成本不断下降,计算速度和存储容量不断高,深度学习技术在图像、音视频、自然语言处理等领域都取得了突破性的进展,也逐步应用于联机手写汉字识别这一传统模式识别领域中。本文结合传统的预处理方法,出了一种笔迹优化算法,使用改良后的四种深度卷积神经网络进行联机手写汉字识别,具体内容如下:1、将联机手写汉字笔迹数据转化为带有方向信息的二值图像,选定一种卷积神经网络作为分类器,对图像数据分别使用十二种基于不同映射函数的自适应长宽比的归一化方法,使用选定的分类器选出最优的归一化方法,对归一化后的笔迹数据使用了四种特征取方法,并使用分类器选出最优的特征取方法。2、针对数据采集过程中容易出现的错误笔迹、冗余笔迹等噪声干扰问题,出一种基于同方向融合相邻笔迹和按比例去除飘移笔迹的优化算法。结合最优归一化方法、特征取方法和选定的分类器进行实验,通过对比四方向、八方向、十六方向和不同的笔迹保留比例对应的识别率来确定笔迹优化的相关参数。3、使用最优归一化方法、特征取方法和笔迹优化算法对联机手写汉字数据集进行处理。选取四种经典网络VGGNet、GoogLeNet、ResNet和DenseNet作为设计基础,使用MXNet框架设计符合实验数据特点的网络结构并进行训练,最后对比分析各种笔迹处理方法和网络。经过实验结果的对比分析,最终选定以中心矩自适应归一化方法和八方向笔迹优化算法为基础的十八通道特征,并使用ResNet网络在中文联机手写数据测试集达到了97.79%的准确率。