基于Hadoop平台的图像匹配算法研究及应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:yl723694886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉的快速发展,数字图像数量呈现爆炸式的增长,图像匹配算法作为数字图像处理技术的一个分支,应用越来越广泛,并且对于其计算速度的要求也越来越高。图像匹配过程一般分为三个步骤:特征点提取、特征点匹配、错误匹配点对的剔除。本文主要完成的是对特征点匹配算法以及错误匹配点剔除算法的改进,提高了运算效率。本文选用的特征点提取算法是SURF算法,特征点匹配算法选用的是KD树算法,代替了传统的线性扫描算法,并且对其进行了改进,将查询路径进行了优化,并考虑了数据节点本身的特性,减小了计算量。对于错误匹配点的剔除,选用的是RANSAC算法,改进了其在选取初始关系矩阵时的不稳定问题,加入了阈值判断,提高了匹配的准确性。接着将改进的图像匹配算法应用到手机界面的自动化测试中,首先利用现有的测试框架截图得到待测图像,之后将待测图像与标准图像进行匹配,根据匹配结果判断界面是否存在文字乱码以及图像分辨率失真等问题,节省了人工成本。该方法根据手机界面的区域特性划分出了文字区域和图像区域,将待测图像和标准图像中的对应区域块分别采用改进的图像匹配算法进行匹配,如果符合初始的阈值条件,再进一步计算两幅图像之间对应区域块的峰值信噪比,判断是否存在分辨率失真的问题。最后不符合匹配条件的界面判别为存在错误的界面。经过实验验证,本文方法检测的准确率能够达到百分之95%以上。由于待测图像的数量较大,实验采取的平台是分布式计算系统Hadoop。首先设计了整个图像匹配算法并行化的过程,然后利用HIPI框架设计了适合处理图像数据的接口,并设计了键值对格式以及Map/Reduce函数。通过实验对比了单机模式与分布式集群的时间效率,可以看出数据量越大,分布式集群的优势越明显。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
教育部组织编写的人教版《道德与法治》七年级(上册)共设四个单元,即第一单元“成长的节拍”、第二单元“友谊的天空”、第三单元“师长情谊”和第四单元“生命的思考”。其
对美国、欧盟等发达国家和地区的大数据研究计划中健康相关部分进行调研,分析其特色,最后提出我国医疗大数据建设发展建议,包括建立数据统一监管体系、统一数据标准与结构、
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
基于投资者情绪视角,以定向增发新股的A股上市公司为研究对象,采用事件时间法实证检验投资者情绪对定向增发新股宣告后的股东财富效应的影响。研究结果表明:由于投资者情绪的渲
提问是幼儿对事物感到好奇,探究问题结论的思维活动,也是幼儿思维发展水平提高的主要标志。所以教师应该正确对待幼儿的提问,使之解除疑惑,掌握粗浅的知识和技能,以发展智力,