印刷体数学公式识别中符号识别技术的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zyfufen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本课题研究数学表达式中符号的识别,因为在科技高度发展的现代,数学表达式是大多数科技文献的核心,对它的研究可以使数学表达式用于检索,提高文献的科技性;实现公式输入的自动化,以解决手动输入的低效率问题;随着计算机网络的发展,网上传递资料成为人们常用的方式,改变数学表达式图片的存在形式,可以节省空间,提高网络的传输速度等。 本文分析了国内外数学公式识别研究的现状,建立一个通用的数学公式识别系统是研究的难点,也是实际应用所需求的。在本系统中,首先对符号图像进行阈值的二值化处理;图像在生成的过程中容易引进噪声,对此进行了图像的平滑去噪;为了得到符号图像清晰的拓扑结构,采用了Hilditch算法进行符号图像的细化处理;由于数学表达式中符号大小的多样性不利于识别,所以对这些符号进行了大小的归一化。然后使用骨架链码法,根据结构分析后的符号的孔洞数及其位置、端点数、角点数等结构特征对数学表达式中常见到的103个符号进行实验初分类,可分成十个小的类,每个小类都对应着一个神经网络。再对符号的数字图像统计字符的9个网格特征和4个交叉点特征,即符号的13维特征向量作为特征值。提取特征值后用神经网络进行训练学习,在课题中采用的模板都是固定标准(大小、灰度级)的。最后用模板匹配的方法进行符号识别。由于计算机编码的限制,有些特殊符号识别的结果就采用其它符号替代的方式进行研究,通过大量实验,103个符号都能够被正确识别出来。
其他文献
在控制领域中,大部分的控制系统都存在时间滞后现象,而这种现象是导致系统性能变差甚至不稳定的主要原因之一。因此,对时间滞后控制系统进行研究,具有重要的理论意义。随着工
计算机技术的飞速发展和信息系统在各个领域中的广泛应用,导致数据爆炸式地增长,基于传统数据库技术建立的信息系统中普遍存在着"数据丰富但知识贫乏"的现象.与此同时,随着市
近年来,无线传感器网络在实际生活中的应用越来越多,人们对无线传感器网络相关技术的研究也越来越深入。由于网络中节点常常采用电池供电,其能量有限,因此,设计出一种合理的
论文以单相非隔离型光伏并网发电系统为研究对象,对系统的拓扑结构、最大功率点跟踪技术、并网控制策略、软硬件设计等关键技术进行了深入研究。  首先,论文综述了课题研究的
人机交互技术将人与计算机或者其他电子设备进行连接,体现人的意志。随着科技的进步,人机交互手段也变得多样化,给人们的生活带来了很多便利。但是目前人机交互大多是通过使用者
本文面向网络管理的实际需求,在济南大学校园网环境中进行网络管理实践的基础上提出网络管理的策略解决方案,并从策略角度出发,选择网络服务和网络应用管理的相关实现技术进行探
人脸识别是目前模式识别中研究的热点,广泛应用于智能监控、公共安防、人机交互等领域。近几年,稀疏表示技术被应用于人脸识别中并取得了良好的分类效果。稀疏保留投影(SPP)是在
伴随着网络技术和多媒体技术的飞速发展,多媒体数据逐渐成为人们获取信息的重要来源,并成为人们生活的重要组成部分。因而,如何保护多媒体信息的安全成为国际上研究的热门课题。
进入21世纪以来,IT技术已经日益渗入人们日常工作和生活,极大地改变了人们的工作和生活条件.数字化社区的建设和发展正是依赖于IT技术逐步走进民居和生活.数字化社区建设主要
本文以天津宝通轻集料有限公司CIMS应用工程的开发为背景,分析了国内外制造业CIMS的发展现状与发展趋势,以及传统流程工业CIMS的体系结构,并根据流程工业的信息集成现状及陶粒企