论文部分内容阅读
本文对手写体字符识别中的特征提取、距离分类方法以及识别系统的性能评价进行了
研究。尤其是对一种新的统计距离方法:切线距离方法进行了研究和探索。在统计切线距
离、基于奇异值分解求解切线向量、变化参数的选择、基于奇异值分解的降维、基于马氏
距离的特征选择等方面提出了自己的新方法。
全文主要的创新点包括以下几个方面:
本文提出了基于切线距离和奇异值分解的统计切线距离新方法。本文把切线距离的概
念进行了进一步的延伸,在原始图像的基础上,用奇异值分解方法直接提取样本集合中所
包含变化的方向,作为训练样本的切线向量。最初的切线距离方法是用经验估计样本中包
含的仿射变化的方向和大小,但是这种方法的应用范围有较大的局限性,而且估计的变化
的方向和大小经常不够准确。切线子空间方法中,把奇异值分解用于迭代中求解切线子空
间参数,但是这种方法计算非常复杂。同时,上述的两种方法都需要对二值图像进行模糊
化。和上述两种方法相比,本方法避免了模糊化的歧意性,处理更加简单;而且它能更准
确的描述训练样本集合中的变化的方向,进一步提高了分类精度。和其它两种方法相比,
具有更强的实用性。实验结果表明,本方法可以得到比欧氏距离低约8至9倍的分类错误
率,比切线子空间的分类错误率降低约4至5倍。本方法即可以单独使用,也可以和k-
均值聚类结合使用,进一步提高分类精度。当聚类个数增加到每一类15个时,得到的分类
错误率为0.0006。此外,随着变换向量个数的增加,统计切线距离的分类精度可以逐渐提
高,同时算法的时间复杂度也逐渐增加。因此可以在允许的时间耗费范围内,选择最大数
目的变换向量,从而获得最佳的分类性能。
奇异值分解降维方法在统计切线距离和切线距离以及切线子空间方法中的应用。利用
奇异值分解进行降维,可以根据样本集合的秩,剔除对分类无意义的冗余信息,实现样本
向量的无损压缩;也可以根据奇异值的大小进行可控误差范围的有损压缩。降维不但可以
降低计算复杂性,而且给工程上经常遇到的高维小子集模式分类问题提供了一种解决方案。
从另一个角度来看,降维方法把切线距离和统计切线距离由高维的像素空间延伸到了低维
的特征空间,这进一步拓展了人们应用切线距离的思路。
本文提出了经验方法求切线向量时变换参数的选择方法,该方法能够使经验求解切线
向量的方法得到最优的分类性能。本文在距离的概念上提出了分类性能函数,作为衡量切
线距离分类性能的准则。并进一步根据分类性能函数的极值点和可线性化区域提出了一个
直接衡量切线距离有效性的性能参数。在使性能参数最大为前提的条件下,选择变换参数
的最佳设定值。本算法克服了以往经验方法求解切线向量时选择变换参数的主观盲目性,
提高了分类器的分类性能。同时,本文中提出的分类性能函数和性能参数可以作为一种有
效的距离衡量准则。
本文中提出了基于矩阵迹函数求导法则的“伪逆法”求解切线距离中切线空间坐标的
方法。以往的求解方法大多是采用梯度法或者牛顿法进行搜索。但是迭代算法的效率非常
低。本文基于对矩阵迹函数求导的法则,推导出了“伪逆法”求解切线空间坐标的公式。
这种方法的意义在于将原来运算耗时极大的二次最小迭代算法用矩阵运算来代替,大大提
高了算法效率。
本文进一步分析了切线距离的理论基础,并结合实验,总结得出了切线距离以下的性
质和应用规律:在切线向量矩阵中增加某种变化在不同变化方向上的切线向量能够提高切
线距离的线性范围和分类精度;双边切线距离比单边切线距离得到更大的线性范围和分类
精度。
本文提出了“基于马氏距离的特征提取”方法,该方法通过迭代得出了类间马氏距离
最大意义下的最优解。在用最小错误概率上界作为衡量标准的情况下,本算法得到了最小
错误概率近似值意义下的最优解。和“基于平均马氏距离特征提取”方法相比,本文中的
算法考虑到了模式的类内和类间的概率分布,类别可分性判据更接近实际情况;当用于多
类情况时,具有更合理的数学表达形式和更明确的物理意义。和“基于巴氏距离的特征提
取”方法相比,在最小错误概率上界上升很小的前提下,大大简化了计算过程,提高了算
法效率。
本文提出了一种针对表单型OCR系统的经验性能评价方法。本文中对表单型OCR系统
的工作流程及算法特点进行了分析,根据OCR系统对大量样本进行识别的统计结果,提取
出多个反映不同角度特性的性能参数,并给出了对这些性能参数进行分析和理解的方法。
根据分析的结果,提出了对表单型OCR系统的改进方案。实验证明,本方法能表征一个表
单型OCR系统多个方面的性能优劣。另外,本方法还提供了指导系统改进的一种反馈手段。
关键词:切线距离;奇异值分解;统计切线距离;降维;小子集统计;最佳变化参数;
手写体数字识别;马氏距离;巴氏距离;特征提取;经验性能评价