印刷体数学表达式自动识别的方法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:xuthusboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅猛发展,利用Internet发布和交换信息更加频繁,同时数字图书馆和远程教育也成为热门领域,因此,信息资源的电子化是至关重要的一个问题。现有的OCR( Optical Character Recognition )技术虽然对中英文字和数字等都能获得很好的识别效果,但无法处理数学表达式。原因在于数学表达式具有复杂的二维嵌套结构,并且符号含义多样性,导致数学表达式在分割和结构分析等方面存在很多困难。为了方便读者和提高文献的利用率,设计一个系统,实现了将图像格式的印刷体数学表达式转换成可编辑的LaTeX格式的数学表达式。所完成的主要工作包括:1、设计实现了一个功能,快速方便地选取文献资料中要识别的数学表达式图像。2、图像预处理的功能是去除噪声,使反映符号本质特征的部分得到保留甚至突出出来,从而正确识别图像内容。3、特征提取与选择是图像识别的一个关键问题。本文对数学符号提取统计特征和结构特征组成45维特征集,对这样的特征集分类识别不受字体限制,而像素特征集受字体影响比较大,不同字体的同一个符号所提取的像素特征集差异可能比较大。并且设计实现K-L正交变换对特征集进行优化处理,去掉冗余信息,经过综合对比,最后确定39维特征集能取得比较理想的识别效果。4、支持向量机(SVM)是在统计学习理论的基础上发展起来的一种最新的机器学习方法。数学表达式识别是有限样本的多类识别问题,本文应用二类组合分类方法中的成对分类法(即一对一)进行符号识别。经过大量的实验,找到比较理想的参数,并与其它相关文献中的实验结果进行了比较,识别正确率有所提高。5、结构分析是数学表达式识别系统与字符识别系统的最大区别,也是难点之一。由于图像预处理时对符号进行了过分割,所以,设计一些规则检测合并多元结构的符号或函数型符号。然后,应用基准线的结构分析算法,使用树的存储形式,采用从上至下的分析策略,思想简单,容易实现,且识别正确率较高,速度较快,适合于数学表达式识别的实时系统。6、TeX系统是国际公认的最好的数学公式排版系统,LaTeX建立在TeX之上。因此,本文把图像格式的数学表达式转化成LaTeX格式的数学表达式。7、本系统全部功能完全在VC++6.0下实现,速度快,界面简洁,使用方便。
其他文献
搜索引擎是从WWW上快速而有效地获取信息资源的捷径,而网络蜘蛛技术则是搜索引擎的关键。本文围绕WEB信息挖掘这一前沿性研究领域课题,结合搜索引擎框架的总体要求,实现了网
网络教学平台是实现网络教学的支撑工具,它为学生和教师提供授课、学习、答疑、讨论以及作业处理等功能性的支持。本论文涉及到的现有网络教学支持平台,在一定程度上实现了教
随着科学技术的进步和公众安全意识的加强,网络视频监控技术日趋成熟,在工业、农业、商业、学校、军事等众多领域得到了广泛的应用。另外不断改善的网络带宽使得流媒体数据的实
医学图像在疾病诊断和治疗中的作用日益重要,因此计算医学图像解剖组织精确的几何模型就成为一个富有挑战性的问题。处理这种问题的一种比较有前途的方法是使用活动轮廓模型。
随着嵌入式系统在各个领域的广泛应用,嵌入式系统设计技术发展迅速。针对传统的嵌入式系统设计方法存在设计质量差,研制周期不能有效保障等问题,业界提出了软硬件协同设计方法。
人脸检测技术经过几十年的发展,已经取得了可喜的成果。特别是在正面人脸检测方面,现有的算法已经达到可以实用的程度。但是由于多姿态人脸的不稳定性,使得在多姿态人脸检测
随着嵌入式系统在家电、娱乐、通讯等领域的广泛应用和硬件水平的不断提高,嵌入式系统越来越需要一个美观的用户界面。用户界面的设计通常需要图形界面开发工具的支持,一款稳
路径规划技术是现代移动导航的核心技术之一,其重要性在近年的研究中不断增加。路径规划问题可定义为在一个存在障碍物的环境中寻找到一条从起点到终点的合适路径,且在过程之中
数字图像配准技术是数字图像处理中一个非常基本的问题,图像配准的目的是将不同传感器、不同视角或者不同时间及不同拍摄条件下得到的两幅或多幅图像在空间上对齐,而且这两幅
肺癌的死亡率远远高于其他癌症,而且近些年来甚至还呈逐年增加的趋势。影像学检查是癌症的诊断、检测和防治方面的重要技术之一。通常意义上的胸部影像学的主要研究对象就是