论文部分内容阅读
在信息化的时代,移动互联网和移动终端已经成为人们生活中最重要的组成部分。而图像作为一种最重要的信息承载形式,是人们获取信息最主要的途径。其中,用户通过终端拍摄照片和各种扫一扫功能,可以传递和获取大量的信息。如何对人们通过拍摄和扫描获取到的图像信息进行进一步的分析和交互,成为计算机视觉领域中的重要课题。而这其中很重要的一点,就是如何从移动终端获取到的图像中,识别出用户感兴趣的目标。本文的立题点即为探索和实践图像的实时检测系统。并结合前沿的AR(Augmented Reality)增强现实效果,对识别到的目标进行AR渲染。让用户在扫描图像的场景下,可以快速识别名片,从中获取经过AR系统增强后,3D动态展示的信息。针对移动端扫描识别名片的场景,本文深入研究了传统匹配算法在移动端的效率和应用实现。首先是SURF(Speeded Up Robust Fea-tures)算法优化:在离线制作数据库和在线实时识别两个不同的场景,分别进行了各自的改进。针对离线数据集,充分构建尺度空间,提取在各个尺度都显著的特征,保证尺度不变性。并通过RANSAC(Ran-dom Sample Consensus)来提纯特征点集,减少图像匹配时的计算量。针对在线实时识别的场景,先计算名片的ROI(Region Of Interest)区域,再简化尺度空间的计算,大大减少了要提取特征的图像的数据量。最终将提取出的特征,与数据集做匹配,得到最终的匹配结果。其次是匹配算法的改进:本文在匹配的过程中引入LRU cache算法来减少匹配过程中需要遍历的数据集中样本的数量,进一步减少匹配过程的时间。最后是利用算法匹配结果对名片进行AR渲染:本文结合AR技术,对识别到的名片利用Unity3D进行AR渲染。本文将Android采集到的原始图像与3D模型视图进行叠加显示,模型随着名片的位置动态移动,名片从单一的图像变成了拥有多媒体展示能力的增强现实信息载体。本文的研究最终落地成一个Android手机应用,经过准确度和响应时间测试,证明了算法和模型的可行性。