论文部分内容阅读
图像识别通过提取图像中蕴含的特征信息,自动识别不同类别目标图像,是机器视觉领域的重要部分之一。如何有效地对图像数据进行处理、分析、应用一直是视觉领域研究的热点。图像识别主要包括图像采集、图像预处理、图像特征提取和图像识别四个步骤。其中,如何提取表达能力强、鲁棒性强的图像特征丞待解决。深度卷积网络具有强大的非线性拟合能力,使得其在众多领域应用广泛,例如人脸识别、生物特征识别、合成孔径雷达(Synthetic Aperture Radar,SAR)目标识别、行人再识别等。深度卷积网络较传统图像识别方法减少了人工特征设计干预部分,通过合理的结构设计可以实现更为优异的性能。但是,针对具体图像识别任务,如何设计有效的卷积结构有待探究。本文以人脸美丽、指背关节纹和SAR图像为研究对象,采用深度卷积网络进行图像识别研究,研究内容主要包括以下三个方面(1)基于BeautyNet的无约束人脸美丽预测。为提升人脸美丽特征信息丰富度,本文构建一个多尺度深度卷积网络BeautyNet。BeautyNet融合多分辨率、多尺度人脸美丽特征,提升人脸美丽特征表达力。为缓解多尺度结构引入的计算量,采用最大特征图(Max Feature Map,MFM)激活函数作为非线性单元。MFM激活函数不仅降低了网络参数计算量,而且加快了模型收敛速度。同时,为缓解小样本任务过拟合问题,本文采用迁移学习策略迁移大型人脸数据库CASIA-WebFace的人脸信息至人脸美丽预测任务。实验结果表明,本文融合BeautyNet和迁移学习策略较大程度提升了人脸美丽预测性能。在大型亚洲人脸美丽数据库(Large Scale Facial Beauty Database,LSFBD)上,BeautyNet取得了67.48%的分类准确率。(2)基于SlimNet的指背关节纹识别。设计了一个SlimNet网络,用于指背关节纹识别任务。其中,该网络采用小尺度卷积块SlimBlock构建网络主体,降低了模型计算量。同时,为提升指背关节纹(Finger Knuckle Print,FKP)图像质量,在SlimNet训练前对香港理工大学的Finger-Knuckle-Print数据库进行感兴趣区域提取(Region of Interest,ROI)。通过边缘检测和矩形窗遍历搜索,实现FKP图像ROI的检测与裁剪。为缓解SlimNet过拟合现象,采用360倍旋转扩充数据。实验结果表明,结合SlimNet网络、ROI提取、旋转数据增强三种方法,SlimNet取得最优FKP识别性能。SlimNet在左手食指、左手中指、右手食指、右手中指数据库上分别取得了97.65%、97.79%、97.31%、97.96%的识别准确率。(3)基于MiniNet的SAR目标识别。设计了一个简单的CNN结构,仅通过两个卷积层实现高效SAR图像目标识别。为降低SAR原始数据库中存在的环境噪声干扰,在MiniNet训练前对SAR图像采用质心法进行ROI提取。此外,为缓解SAR目标识别训练数据量不足的问题,对ROI图像进行360倍旋转增强。在实验设置方面,探索了训练次数、卷积核尺寸、网络层数三个因素对SAR目标识别准确率的影响。经过模型参数优化,MiniNet在MSTAR数据集上取得了97.29%的识别准确率。