论文部分内容阅读
人脸美丽预测是针对不同人脸图像所具有的美学特征,采用机器学习方法进行美丽程度智能预测,从而让机器具有与人类似的人脸美丽感知智能。人脸美丽预测所用的美学特征主要是几何特征和表观特征。其中,几何特征提取依赖人工的特征选择,过多主动因素介入会导致所获结果没有普适性;表观特征提取虽然不用标定人脸特征点,且无需过多人工介入,但主流方法只是采用特征脸、纹理信息等初级特征来表征人脸美丽信息,未涉及更具有结构性、层次性的特征表达。人脸美丽研究是近年来才兴起的研究课题,国内外研究者所使用的人脸美丽样本库都是基于少有公开的小样本库,而训练样本的缺乏无疑给研究工作带来难题。深度自学习模拟人的大脑深度组织结构,以不依赖人工的方式对多层次特征进行自动学习和特征提取,并借助自学习弥补训练样本数量的不足,为人脸美丽预测研究提供了更科学的理论依据。本文提出用深度自学习来对人脸美丽进行智能预测,主要工作包括:(1)利用自学习方法训练网络,弥补训练样本的不足,提高网络对人脸图像美丽信息的学习能力。自学习方法通过学习未标注样本的特征信息,且未标注样本不要求与已标注样本同类型或同分布,用这些特征信息来表征已标注样本的特征,能有效避免网络的不充分训练。卷积受限波尔兹曼机(Convolutional Restricted Boltzmann Machine, CRBM)是一个具有层次性的网络,其池化层所提取的表征特征在特征维数减少的同时使输入图像在局部位移变化的情况下仍保持特征不变性。利用自学习方法对CRBM进行非监督预训练,有助于网络更充分地学习到人脸图像美丽信息,更有利于人脸美丽预测。(2)研究了人脸美丽预测中更有效的美学特征提取。针对特征脸、LBP (Local Binary Pattern, LBP)和Gabor纹理特征,以及CRBM的池化层所提取的表观特征这四种美学特征,本文利用支持向量机和K近邻这两种分类器来分析这四种美学特征表征人脸图像美丽信息的能力。同时,还研究了有无自学习情况下卷积受限波尔兹曼机在人脸美丽预测中的性能。实验结果表明,由自学习和CRBM相结合所提取的表观特征,相比于特征脸、LBP和Gabor纹理特征,更能有效表征人脸美丽特征信息,且能对人脸美丽程度进行更准确的预测。(3)探索人脸美丽预测中更准确的回归方法。本文比较了线性回归、K近邻回归、Logistic回归、岭回归、支持向量机回归这五种回归模型在人脸美丽预测中的性能。实验结果表明,在五种回归模型中SVM回归具有更好的人脸美丽预测性能;同时,进一步证明由CRBM所提取的表观特征是一种更好的美学特征。(4)利用卷积深度信念网络(Convolutional deep belief network,CDBN)和自学习相结合所形成的深度自学习方法,学习到人脸图像更具结构性的美丽信息,并实现准确的美丽程度智能预测。本文通过自学习方法对卷积深度信念网络进行非监督预训练,为深度网络参数提供良好的优化起点。探讨了分别将像素级人脸图像及其LBP和Gabor特征作为深度网络输入时的CDBN一层与两层的人脸美丽预测效果;比较了深度自学习在不同分辨率图像和五种回归方法下的预测性能。实验结果表明,当LBP纹理特征作为深度网络输入并融合两层CDBN的表观特征时,利用SVM回归方法使机器打分与人工打分具有高度一致性;且随着图像分辨率增加,人脸美丽预测性能也随之提高。