论文部分内容阅读
中国的古文化博大精深,源远流长。其中古汉字是我们了解中国历史,政治,经济,人文风俗的载体。在最初时简牍是最主要的文字载体,直到纸的出现,才结束作为文字载体的历史,因此简牍文字对民族文化的继承和发展具有重要的意义。简牍文字具有异体字多,局部形变,大量噪声等特点,对于人工的简牍文字研究不仅需要大量的人力物力,并且进度缓慢,因此运用先进的现代科技的数字图像处理、模式识别等技术,进行简牍文字提取与识别的研究有重大的意义。本文以数字化图像处理和模式识别作为理论指导,首先对简牍文字图像的样本进行灰度化、二值化、去噪、细化、反色以及归一化等预处理,并在图像去噪中提出新的自适应加权中值滤波算法,采用分数阶微分的方法对图像噪声进行检测,对含噪声的图像依据噪声点的数量自适应确定滤波窗口大小,并自适应计算权值,对噪声点进行加权中值滤波。结果能达到更好的去噪效果并保留了更多的文字细节,有利于后续的文字识别。然后进行特征提取,特征提取作为文字识别中必不可少的步骤,本文提出了双弹性局部密度特征和整体广义密度特征,部件结构特征这三个特征融合的方法,弥补了单一特征的不足,较好的满足了高稳定性,准确性。最后在标准BP神经网络和改进BP神经网络中对简牍文字进行识别研究,实验结果表明多特征融合具有较高的识别率从而也证明了多特征融合的有效性。