面向中文矢量笔迹中单字详细分类的特征和方法比较

来源 :计算机应用研究 | 被引量 : 5次 | 上传用户:wendiii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在识别矢量笔迹文本时,不同类型单字需要采用不同识别器,确定详细类别是单字识别的前提。对实际中文矢量笔迹文本中单字进行汉字、标点、数字、字母和单词的详细分类,提出了自身和相对(包括近邻和同行)特征,选用决策树、逻辑模型树、贝叶斯网络和支持向量机四种分类器。针对大量实际数据,测试和比较了多种特征和分类器的性能。实验表明,近邻单字的组合特征具有较好的分类能力,支持向量机对各种单字均有较好分类性能。
其他文献
在分析中文印刷文档版式及字符特征的基础上,提出了一种将决策树与BP神经网络相结合的数学公式抽取方法。采用决策树方法将孤立公式从文档中抽取出来,采用BP神经网络方法定位内嵌公式。实验表明,该抽取方法对中文文档的公式抽取具有较高的正确率、容错率和速率。
对于能量有限的传感器网络,在计算复杂度较高的应用中,节省CPU的能耗具有重要意义。针对以事件为驱动的无线传感器网络的任务模式,提出一种基于零散任务模型的自适应DVS算法——A-DVS。A-DVS算法根据CPU的任务量实时调整工作频率和电压,能在很大程度上降低CPU能耗的同时,保证任务的实时性要求。理论分析和实验结果表明,A-DVS算法的实际节能效果接近理论分析值的80%左右,可在很大程度上延长节点
MCNP是辐射屏蔽设计优化的基本工具。针对MCNP存在输入接口复杂、耗时等问题,提出开发MCNP三维可视化平台。采用组件技术建立具有多层体系结构的MCNP三维可视化平台模型,并对构成系统的核心组件进行分类和功能划分。
提出了一种基于凹多边形凸分解的相容三角剖分方法。先将凹边形分解成凸多边形,再对子多边形进行三角剖分,即可实现相容三角剖分。在最坏的情况下添加O(jk)个辅助点,时间复杂度为O(jn+nlogn+jklogn)