论文部分内容阅读
名片在日常生活和工作中起着非常重要的作用,已经成为人类重要的身份信息载体。由于名片中包含姓名、地址、电话号以及网址等信息,使得大部分名片为双语混排名片。当前亟需解决名片识别中英文混排情况下,名片识别的速度较慢,准确率较低的问题。本论文研究OCR名片识别方法的新技术进而弥补上述名片识别技术中存在的不足。本文针对现有的二值化方法在名片识别中存在的问题,如全局阈值分割的方法准确度较低,局部阈值二值化方法产生伪影且运行速度较慢,以及全局阈值与局部阈值相结合的二值化算法在处理复杂版式名片时效果较差等缺点,研究了一种全局阈值与局部阈值相结合的优化算法,该方法采用类间方差法对最佳全局阈值进行计算,距阈值较远的像素点,选用全局阈值法对其进行二值化;距阈值较近的像素点,选用局部阈值法对其进行二值化,使得图像的二值化效果更加清晰。采用数学形态学上的膨胀算法对名片图像进行版面分析处理,完成图像版面块的划分。然后利用投影法版面块属性判定,提出文字块。该算法能够快速准确的对复杂名片的版面进行分析。本文针对传统中英文混排的字符识别技术存在的切分不完善、识别率低等问题进行研究,提出了反馈识别的单元合并算法,将左右结构汉字在字符切分时误切分的汉字部件进行合并。实验表明,该方法优于常规的部件合并方法。部件合并后,对粘连的中英文字符进行检测和重切分,提高字符识别准确率。最后,对名片文本信息进行分类,在启发式规则分类的基础上,加入了版面信息对其进行辅助分类,大幅度地提高了文本信息分类的准确性。本论文利用提出的方法对名片进行测试,并与原有方法测试的结果对比分析,得出基于OCR技术的名片识别方法识别准确率高、复杂低和速度快,适用于各种版式的名片。