论文部分内容阅读
人脸美丽分析是人们利用智能算法探索自然规则的新兴研究方向。与人脸识别、情感分析以及性别分类等生物特征识别不同,人脸美丽不存在客观统一的标准,从而使该课题更具有挑战性。近年来,研究者们在人脸美丽分析方面取得了许多具有重大意义的研究成果,而其中大部分具有一定的局限性。首先,研究者们采用的实验对象都是自建的人脸美丽数据库,暂未有统一的标准数据可用且规模普遍较小,因而不足以对美丽的结构信息进行综合而全面的建模分析和验证;其次,研究者们对实验环境进行了统一。即对人脸样本进行大量的背景去噪、人脸校准等预处理,从而使实验数据处于限制环境下。该过程耗时耗力并且去除了许多与美丽相关的细节,因而很难用于工程实践;最后,表观特征不需要人工标定特征点,且能从整体到局部描述几何特征无法描述的美丽信息,但用表观特征研究人脸美丽的成果较少。根据上述分析,本文从人脸美丽数据库的构建以及表观特征学习算法分析出发,对非限制环境下的人脸美丽进行研究,主要工作如下:(1)人脸美丽数据库的构建是人脸美丽研究的难点之一,其原因在于:研究者很难获取较多的极端美丽样本,大部分样本的美丽程度处于平均水平,从而给算法对美丽的统计分析带来局限;对人脸样本进行人工评分存在诸多的影响因素,如身心状态、外部环境等均会对参评的志愿者产生影响,从而影响最终的评分结果。为了解决上述问题,本文利用经典图像处理与识别算法构建了人脸样本自动获取框架,并对现有评分方案进行了改进,设计了一个更适合大规模样本评分的人工评分方案,然后在此基础上建立了一个美丽分布更合理的大规模的非限制人脸美丽数据库。(2)在非限制环境下获取的人脸图像易受诸多环境因素的影响,如姿态、光照、表情、背景、成像质量以及遮挡等。研究者通常采用高强度的人工干预来排除这些因素,从而得到了较高的预测精度。本文对非限制环境下的人脸美丽进行分析,即对输入特征仅进行简单的预处理操作,如直方图均衡以及白化,然后直接将其作为输入特征进行特征学习,从而避免了繁重的人工操作及主观介入。(3)表观特征是本文研究的重点。本文阐述了几种经典的表观特征学习算法,如卷积受限玻尔兹曼机(Convolution restricted Boltzmann machine,CRBM)、特征脸、K-means无监督图像编码算法,并将上述算法用于人脸美丽特征提取。然后,通过实验对比所提取特征的美丽表征能力。实验结果表明K-means无监督图像编码算法和CRBM能够结合自学习,充分利用大量易获取的无标签样本,提高预测性能。然而,上述算法只涉及浅层的表观特征如细小边缘、角点等,这些特征对于抽象的美丽细节很难进行描述。为了提取更丰富更有表征力的表观特征,本文在K-means无监督图像编码的基础上探讨并构建了多尺度K均值特征学习模型(Multi-scale K-means,MSK)。该算法能够学到多尺度的目标结构特征,从而对人脸浅层特征或者人脸结构之间的空间相对位置以及几何形状等信息进行表征。这些信息一定程度上对人脸美丽产生较大影响,且是简单的表观特征所不能很好描述的。实验结果亦表明,多尺度的目标结构特征能够取得最好的预测性能,且拥有相对较少的算法时间消耗。