论文部分内容阅读
随着计算机信息处理技术水平的不断提高及计算机应用领域的日益广泛,对于解决汉字教学中错字和古籍整理中的异体字等集外汉字的计算机处理问题的需求日益强烈。目前计算机还没有一种面向集外汉字输入输出处理的有效解决方案,本文针对这一问题设计实现了一种面向字形分析的汉字输入输出处理系统,使用该系统可以有效的实现集外汉字输入输出。同时能把手写输入的汉字转换为一种统一的网格字形形式,为字形的比对分析建立基础。首先,这种处理方法采用了把汉字字形看做是一个统一的整体图形这一新思想,而没有采用把汉字字形拆分成基本笔画来处理的传统思想。在新思想的指导下,本文重点研究了手写汉字转化为用于字形分析的网格字形模型的规整化处理方法。经过对手写汉字字形的大小规整、笔画方向规整和点位置规整等步骤最终实现了把手写汉字规整到网格字形模型这一目标。其次,针对生成的汉字网格字形数据,进一步设计实现了一个交互编辑系统。该系统主要由移动笔画、增加笔画和删除笔画等编辑功能组成。该系统在程序设计时使用了MVC的设计思想。使用者利用该系统可以进一步对自动生成的网格字形中不规范或错误的部分进行编辑修改,生成统一规范的网格字形。然后,为了使生成的网格字形也能在文本中显示输出,需要按照TrueType字库格式的要求,提取出网格字形的轮廓线。本文研究了网格字形轮廓的自动提取方法,设计实现了一个网格字形轮廓的自动提取算法,通过识别连通区域、抽取区域边界线、边界点有序化和提取特征点等步骤,最终按TrueType格式的要求生成了网格字形的轮廓数据。最后,在充分研究了TrueType字库中汉字轮廓数据的读写机制的基础上,设计实现了将网格字形轮廓数据写入TrueType字库的算法。最终生成了网格字形的TrueType字库。利用该字库可以实现网格字形的正常显示输出。