论文部分内容阅读
目标检测是计算机视觉的主要任务之一,具有广泛的应用。随着智能视频监控、无人驾驶技术和智能医疗等应用的快速普及和布局,图像序列中显著目标的检测得到了广泛和深入的研究。然而,对于遮挡较为严重、密集和小尺度等动态非显著目标的检测仍然是一种富有挑战性的技术,已成为计算机视觉走向实际应用的瓶颈,还存在一些关键技术亟待突破,包括:防欺诈性、实时性和稳定性等;对于无人驾驶、智能机器人以及无人机等在大面积或不规则的特定区域作业的应用,如何快速精确地检测出特定区域范围以及其边界所在位置,也是目标检测技术中面临的主要问题。对于防欺诈性问题,针对活体人脸检测应用,借助近红外光线在3D和2D的人脸的分布不同,提出迭代二次帧差模型,快速提取具有显著性差别的活体人脸和非活体人脸特征,再创建PCA用于活体人脸检测的通用子空间模板。在2.3GHz CPU硬件条件下检测一帧图像所用平均时间为1.57ms;在18个人的近红外自建数据库中测试,当人脸正对近红外光源和抬头时,检出率为100%;人脸右侧或左侧30°时,其检出率为98%;低头30°时,其检出率为97%。实验结果证明本文提出的活体人脸检测模型具有快速性和高的检测精度。对于实时性和稳定性问题,为提高单张图像中人脸的检测精度和速度,改进参数少、精度高的Mobile Net基础网络,增加八个标准卷积层、BN和Re LU6的组合结构,用于提高网络的表征能力。在此基础上由底层到顶层的构建特征金字塔式元结构,建立Mobile Net-SSD(MS)快速人脸检测模型。针对图像序列中的人脸快速稳定检测,将MS模型与基于Hog的核相关滤波算法相融合,构建MS-KCF模型。在GPU GTX 1080硬件条件下,MS模型在WIDER FACE公开数据基准中Easy、Medium和Hard测试子集的召回率分别为93.11%、92.18%和82.97%,在FDDB公开人脸数据基准的召回率为93.60%,测试平均速度为84fps;MS-KCF模型在OTB数据基准中角度变化过大和遮挡较为严重的Girl和Face Occ1图像序列中测试,召回率分别为84.3%和94.6%,测试速度为193fps。实验结果证明本文提出的MS模型和MS-KCF模型具有快速性、稳定性以及较高的检测精度。对于大面积或不规则区域辨识以及其边界检测问题,针对草坪边界检测的应用,提出快速精确的PULNet语义分割网络,以及能够体现区域内像素值变化的八邻域编码遍历法定位边界位置。在ADE20K公开数据基准中验证,具有32.86%的平均区域重合度,75.65%的平均像素精确度,对于512×512大小的图片,在GPU GTX 1080Ti硬件下的测试平均速度为82.7fps;在具有9134张不同环境和天气状态下自建草坪数据库以及现场测试,具有96.32%的平均区域重合度,对于848×480大小的图片,在GPU GTX 1080Ti硬件下测试平均速度为67.3fps,在GPU GTX1050,CPU I5-7300hq的笔记本电脑下测试平均速度为30.3fps。实验结果证明本文提出的PULNet语义分割网络以及八邻域编码遍历法具有较高的边界检测精度和较快的速度。