统计切线距离方法的研究及其在手写体字符识别中的应用

来源 :同济大学计算机科学与工程系同济大学 | 被引量 : 0次 | 上传用户：yueyinxiangzhu

【摘要】

：

本文对手写体字符识别中的特征提取、距离分类方法以及识别系统的性能评价进行了研究。尤其是对一种新的统计距离方法：切线距离方法进行了研究和探索。在统计切线距离、基于奇

【作者】

：

管聪慧

【机构】

：

同济大学

【出处】

：

同济大学计算机科学与工程系同济大学

【发表日期】

：

2002年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文对手写体字符识别中的特征提取、距离分类方法以及识别系统的性能评价进行了研究。尤其是对一种新的统计距离方法：切线距离方法进行了研究和探索。在统计切线距离、基于奇异值分解求解切线向量、变化参数的选择、基于奇异值分解的降维、基于马氏距离的特征选择等方面提出了自己的新方法。全文主要的创新点包括以下几个方面：本文提出了基于切线距离和奇异值分解的统计切线距离新方法。本文把切线距离的概念进行了进一步的延伸，在原始图像的基础上，用奇异值分解方法直接提取样本集合中所包含变化的方向，作为训练样本的切线向量。最初的切线距离方法是用经验估计样本中包含的仿射变化的方向和大小，但是这种方法的应用范围有较大的局限性，而且估计的变化的方向和大小经常不够准确。切线子空间方法中，把奇异值分解用于迭代中求解切线子空间参数，但是这种方法计算非常复杂。同时，上述的两种方法都需要对二值图像进行模糊化。和上述两种方法相比，本方法避免了模糊化的歧意性，处理更加简单；而且它能更准确的描述训练样本集合中的变化的方向，进一步提高了分类精度。和其它两种方法相比，具有更强的实用性。实验结果表明，本方法可以得到比欧氏距离低约8至9倍的分类错误率，比切线子空间的分类错误率降低约4至5倍。本方法即可以单独使用，也可以和k- 均值聚类结合使用，进一步提高分类精度。当聚类个数增加到每一类15个时，得到的分类错误率为0．0006。此外，随着变换向量个数的增加，统计切线距离的分类精度可以逐渐提高，同时算法的时间复杂度也逐渐增加。因此可以在允许的时间耗费范围内，选择最大数目的变换向量，从而获得最佳的分类性能。奇异值分解降维方法在统计切线距离和切线距离以及切线子空间方法中的应用。利用奇异值分解进行降维，可以根据样本集合的秩，剔除对分类无意义的冗余信息，实现样本向量的无损压缩；也可以根据奇异值的大小进行可控误差范围的有损压缩。降维不但可以降低计算复杂性，而且给工程上经常遇到的高维小子集模式分类问题提供了一种解决方案。从另一个角度来看，降维方法把切线距离和统计切线距离由高维的像素空间延伸到了低维的特征空间，这进一步拓展了人们应用切线距离的思路。本文提出了经验方法求切线向量时变换参数的选择方法，该方法能够使经验求解切线向量的方法得到最优的分类性能。本文在距离的概念上提出了分类性能函数，作为衡量切线距离分类性能的准则。并进一步根据分类性能函数的极值点和可线性化区域提出了一个直接衡量切线距离有效性的性能参数。在使性能参数最大为前提的条件下，选择变换参数的最佳设定值。本算法克服了以往经验方法求解切线向量时选择变换参数的主观盲目性，提高了分类器的分类性能。同时，本文中提出的分类性能函数和性能参数可以作为一种有效的距离衡量准则。本文中提出了基于矩阵迹函数求导法则的“伪逆法”求解切线距离中切线空间坐标的方法。以往的求解方法大多是采用梯度法或者牛顿法进行搜索。但是迭代算法的效率非常低。本文基于对矩阵迹函数求导的法则，推导出了“伪逆法”求解切线空间坐标的公式。这种方法的意义在于将原来运算耗时极大的二次最小迭代算法用矩阵运算来代替，大大提高了算法效率。本文进一步分析了切线距离的理论基础，并结合实验，总结得出了切线距离以下的性质和应用规律：在切线向量矩阵中增加某种变化在不同变化方向上的切线向量能够提高切线距离的线性范围和分类精度；双边切线距离比单边切线距离得到更大的线性范围和分类精度。本文提出了“基于马氏距离的特征提取”方法，该方法通过迭代得出了类间马氏距离最大意义下的最优解。在用最小错误概率上界作为衡量标准的情况下，本算法得到了最小错误概率近似值意义下的最优解。和“基于平均马氏距离特征提取”方法相比，本文中的算法考虑到了模式的类内和类间的概率分布，类别可分性判据更接近实际情况；当用于多类情况时，具有更合理的数学表达形式和更明确的物理意义。和“基于巴氏距离的特征提取”方法相比，在最小错误概率上界上升很小的前提下，大大简化了计算过程，提高了算法效率。本文提出了一种针对表单型OCR系统的经验性能评价方法。本文中对表单型OCR系统的工作流程及算法特点进行了分析，根据OCR系统对大量样本进行识别的统计结果，提取出多个反映不同角度特性的性能参数，并给出了对这些性能参数进行分析和理解的方法。根据分析的结果，提出了对表单型OCR系统的改进方案。实验证明，本方法能表征一个表单型OCR系统多个方面的性能优劣。另外，本方法还提供了指导系统改进的一种反馈手段。关键词：切线距离；奇异值分解；统计切线距离；降维；小子集统计；最佳变化参数；手写体数字识别；马氏距离；巴氏距离；特征提取；经验性能评价

其他文献

基于信息迁移技术的过程监测方法研究

过程监测是保证生产安全、稳定运行的一个非常重要的措施。基于数据驱动方法建立的过程监测模型需要大量的数据信息,信息的不足易发生误报而影响对生产的监控。本文针对过程

学位

过程监测拓展主成分分析联合输出偏最小二乘递归主成分分析

并行蚁群算法的研究

蚁群算法是近年来一种新兴的群智能算法,在解决大规模组合优化问题中取得很好的效果,具有广阔的发展前景。然而,现有蚁群算法的内在机制存在不足,限制了其性能的充分发挥。因

学位

蚁群算法并行计算模式学习混沌

黑体空腔式钢水连续测温系统便携式检定装置设计

炼钢—连铸生产过程中,中间包钢水温度是影响钢材质量和实现连铸闭环控制的重要因素。黑体空腔式中间包钢水测温系统基于黑体空腔理论的研究成果,实现中间包钢水温度精确连续

学位

近红外LED黑体辐射检定装置钢水温度

中小型企业管理信息系统研究与实现

该论文介绍了作者在进行某中小型企业管理信息系统（MIS）开发过程中的实际工作,并由此对中小型企业管理信息系统的开发设计进行了研究,力图给出一个适于中小型企业的管理信息系

学位

中小型企业管理信息系统结构化分析原型法业务流程重组面向对象

基于数字信号处理器的神经元遗传算法自适应PID控制

单神经元自适应PID控制是一种实现简单的智能控制策略，其神经元的学习通常使用有教师的Hebb学习规则。本文提出一种有教师的Oja学习规则，并将这种规则引入了神经元的自适应学习

学位

神经元Oja学习规则自适应PID控制遗传算法（GA）数字信号处理器（DSP）

气固两相流参数（流型、速度及其分布）测量方法研究

该文以电容层析成像系统为研究对象,针对气固两相流图像重建、流型辨识、速度及其分布测量中的有关问题进行探讨和研究。

学位

气固两相流电容层析成像流型辨识图像重建空间滤波模糊聚类分析神经网络小波变换

关于智能色谱工作站的研究和开发

作者简要介绍了色谱工作站硬件部分的设计,较详细地介绍了色谱工作站软件部分的设计,并介绍了工业色谱仪项目中的谱峰处理部分设计与色谱工作站项目中该部分在设计中的不同.

学位

色谱工作站色谱色谱峰VC++色谱峰识别小波变换设计方法

企业过程建模及其支持系统的研究与应用

企业过程建模作为一项支持企业过程集成与优化的共性技术,是对企业系统中与企业过程有关的特性加以抽象表达并动态仿真企业内部各种行为活动的一种方法,是企业过程集成成功的

学位

企业过程建模过程仿真过程优化企业建模企业集成建模企业工程企业过程工程

错误处理技术与可靠性模型在分立器件测试软件中的应用研究

半导体分立器件作为一种关系国计民生的支柱性产业，随着科技的逐步发展，在人们生活、生产中占据重要的地位。而分立器件大规模量产时，如何利用自动化检测设备实现自动化的测试，一

学位

半导体分立器件错误处理可靠性模型测试软件

数据挖掘技术应用研究

该文包括数据挖掘的基本概念、数据仓库的相关技术、数据挖掘的数据预处理技术(包括数据清理、数据集成和转换、数据归约等方法)、以及传统关联规则挖掘及Apriori算法、模糊

学位

数据挖掘数据仓库关联规则Apriori算法模糊关联规则

统计切线距离方法的研究及其在手写体字符识别中的应用

其他学术论文