基于Android的光学字符识别研究与实现

被引量 : 15次 | 上传用户:wilson168168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Android手机平台的普及和信息化进程的不断推进,利用手持设备高效地将文档信息录入已经成为一个亟需解决的问题,其关键技术光学字符识别在手机上的应用日益受到人们重视。本文所做工作正是针对这一问题而展开。本文设计的Android平台光学字符识别通过手机摄像头拍摄的方式将纸质的文档以图像的形式录入手机,通过与Android NDK编程结合的预处理、特征提取及模版匹配等一系列的处理,获取与录入图像对应的电子文本输出。本文主要研究内容如下:(1)前期预处理算法对比选取。对比四种常见噪声的领域平均法和中值平均法去噪效果,选出灰度化及去噪分别采用加权平均法及3×3中值平均法。(2)光照补偿及二值化研究设计。针对同态滤波算法进行研究,最终选取避免参数调整的改进的同态滤波算法进行光照补偿,比较了两种全局阈值和两种局部阈值算法,选择补偿图像处理效果较好的Bernsen算法进行二值化处理。(3)倾斜字符校正、字符分割及归一化分析确定。研究文本图像中较常出现的旋转与水平倾斜,选取投影法方差最大与二阶原点矩最大进行检测并进行相应的校正。研究找到了一种可以很好的处理垂直投影算法所无法解决的字符间因重叠而无法分割的问题的连通域搜索生长算法。讨论三种插值变换的归一化算法,选取复杂度居中但能满足实际要求的双线性插值算法。(4)分类器及特征提取方案确立。对比研究两种特征提取方式结构特征和统计特征,其中,结构特征区分相似字的能力较强,而统计特征抗噪声和干扰的能力较强,因此本文采用粗网格特征、宽度投影特征和笔画密度特征的结构与统计特征相结合的特征提取法。对比三种判定距离欧氏距离、马氏距离和街区距离的优缺点选定欧氏距离为判定函数。(5)设计实现Android平台光学字符识别。结合Android NDK技术,利用Java Native Interface接口,在windows系统下,利用jdk6.0、Eclipse SDK-4.3-win32、android-sdk_r06及ADT0.9.7开发出应用软件。充分测试了在不同场景下系统识别效果,包括光照实验及存在倾斜情况下都能很好识别出图像中的字符。通过100次采样,对图片中的3164个样本进行数据统计分析,其中包含大小写英文字母52个和数字10个,共62个字符类型,得到总体识别正确率达91.5%,字母和数字分别为92.0%和88.1%。
其他文献
采用质地多面分析方法(TPA),以清水处理为对照,研究碱性钙(氧化钙、氢氧化钙)、无机钙(氯化钙、碳酸钙、硫酸钙)、有机钙(乳酸钙、醋酸钙、丙酸钙)对干装苹果罐头质地参数(硬度、回复性
随着中国城市化建设进程的逐渐深入,园林绿化市场也在受到国家与地方政府越来越多的重视。众多园林绿化企业随着市场的发展应运而生,同行业的竞争随着参与者的增加正变得日趋
近年来上市公司高管薪酬问题一直备受社会关注,上市公司高管薪酬激励过度,高管薪酬与公司业绩相背离的报道频繁见诸于媒体。从现有的文献来看,薪酬激励并不能很好地解决委托-代
在基础教育课程改革及新课程理念的指引下,教师专业化是世界教师教育发展的趋势和潮流,培养出具有丰富广博的基础知识、较完善的能力结构,又具有敏锐的观察力以及发现问题并采用
随着因特网的快速发展和全球化进程的加快,因特网所提供的信息资源不再集中于英语等少数几种语言上,人们使用母语去查询不同语言表示的信息的需求不断增加。跨语言信息检索(Cros
孟子是一位有着强烈责任意识的思想家,在他的行为和思想中有着丰富的“责任”意识,在这些“责任”意识中已经具有了责任、责任伦理的基本精神。尤其是对政治权力体系中的君、臣
地理信息系统已经由2维系统逐渐向3维系统的方向发展。3DGIS可以提供逼真的可视表达方法。在3DGIS统中3维空间对象包含空间属性信息和非空间属性信息。3DGIS针对数据模型要具
详细介绍了以朝阳三二九转播台智能管理监控系统为平台,增加信源比对系统的设计组成、工作原理及功能应用。针对中波转播台的安全播出工作智能化方向,通过网络技术的合理结合
当今时代企业改革重组如同浪潮席卷中国大地。国有企业的改革重组正在不断深化,经营性国资进一步集中到关系国家战略、国计民生、城市安全、基础资源领域,集中到现代服务业、
2010年,《国家中长期教育改革和发展规划纲要(2010-2020年)》提出“要加快缩小城乡差距,建立城乡一体化义务教育发展机制”的发展任务。当前城乡义务教育差距较大,各地区均在推进