【摘 要】
:
移动终端设备的迅速发展和普及,使人们通过手机或Pad获取周围信息成为可能。传统的信息获取方式是通过用户输入看到的周围环境中的文字来获得相应结果,而下一代的人机交互将通
论文部分内容阅读
移动终端设备的迅速发展和普及,使人们通过手机或Pad获取周围信息成为可能。传统的信息获取方式是通过用户输入看到的周围环境中的文字来获得相应结果,而下一代的人机交互将通过手持设备拍照自动识别图像中的文字并返回相应结果。这将对现有的用户体验产生革命性的变革。
本文针对这一应用目标,对手机拍摄的场景图像进行研究,定位并识别图像中的文字。本文主要针对两种场景进行研究:室内拍摄的名片场景和室外招牌场景,针对两种场景构建了相应的数据集,同时使用了场景图像研究领域中普遍采用的ICDAR数据集进行研究。
定位方面:本文针对名片场景的特点提出了基于canny算子进行边缘检测的图像前景提取方法,然后使用形态学膨胀方法合并连通域并抽取5种字符区域特征进行精确定位;针对招牌场景的特点提出基于图像分割的改进大津法——BlockOtsu二值化方法进行图像前景提取,设计7种字符区域特进行精确定位。
识别方面:名片场景图像中的文字为印刷体,本文使用Tesseract-OCR开源引擎作为字符识别分类器;对于招牌场景,训练卷积神经网络作为字符识别分类器。
本文对实验算法的时间性能进行研究,提出算法实时性的要求。针对定位和识别算法的时间进行优化和改进,尤其是Tesseract-OCR,最终的改进结果大幅提高时间性能,使算法移植到移动平台成为可能。
其他文献
SOA是“面向服务的体系架构”,它可以根据需求通过网络对松散耦合的粗粒度应用组件进行分布式部署、组合和使用。SOA架构是一种粗粒度、开放式、松耦合的服务结构,要求软件产
随着计算机和互联网技术的蓬勃发展,网络中信息量成指数增长,互联网步入大数据时代,信息过载问题日益明显。个性化推荐引擎能够帮助用户从海量的数据中辨别、过滤信息,主动给
随着互联网的快速发展,网上的信息数据呈指数级的速度迅猛增长。用户如何在短时间内获取自己所需信息变成为难题。信息检索是有效解决上述情况关键技术。它按一定方式组织信息
随着互联网的飞速发展,网上传播的数字内容存在着大量的盗版和侵权问题,因此对网上交易的数字内容进行版权管理和保护,这成为一个迫切需要解决的问题。但现在的数字版权保护
Timed-Release Encryption(TRE,译作“时释性加密”)的目标是“发送一个消息给未来”[1],即发送者加密一个消息,发送给接收者,接收者只有在指定的发布时间到达的时候才能解密这个消
随着军队信息化的建设发展,电子公文在网络间传输更需要唯一、合法,防非法复制、防非法篡改且可追溯,因此,本文研究设计了一个适用于军队办公环境的电子印章系统,在网络环境下实现
随着互联网技术的迅速发展,社会各行各业都在通过网络与外界交互信息,Web信息呈显海量和多元化,并且仍在急剧增长。在越来越多的实际应用需要从Web中抽取有价值的信息加以利
故障诊断是一种利用故障信息之间的逻辑关系和故障机理联合分析而进行故障的辨识与定位的技术。建立合理的诊断模型以及消除诊断过程中的不确定性问题带来的故障扰动,一直是
本文旨在对林分的三维建模方法进行研究,并实现林分生长的可视化系统,为森林资源的可视化模拟和林区的虚拟规划提供应用软件平台、为森林的生产和经营提供有价值的信息和参考
在这个数字信息飞速发展的今天,移动设备也得到快速地普及。以往仅仅输入密码的认证方法极易受到网络钓鱼和按键记录软件的攻击,并且移动设备极易丢失、被窃或者被别的用户使