基于生成对抗网络的多视角人脸生成及辅助识别

来源 :南昌大学 | 被引量 : 0次 | 上传用户:datou19881020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习技术具有强大的学习能力,但基于深度学习的方法需要学习很多模型参数,为了避免模型过拟合通常需要大量的训练样本,而这一要求在当前的人脸数据库中难以得到满足,导致与人脸问题相关的计算模型的准确率很难得到进一步提升,因此越来越多的研究者试图通过生成模型对人脸数据集进行增广,尤其是针对跨年龄、多视角人脸数据集的增广。现有的多视角人脸图像生成方法存在以下问题:(1)在训练模型时需要使用成对图像,即同一人脸多个视角的图像;(2)基于监督学习,需要大量人脸图像的视角标签,甚至需要对鼻子、眼睛、嘴巴等器官进行标注。然而,大规模成对人脸图像难以获取,且标注这些数据需要庞大的人力成本。因此,研究基于非成对图像的半监督式多视角人脸生成方法,具有重大的现实意义和应用价值。针对现有多视角人脸图像生成方法存在的问题,本文提出一种基于生成对抗网络的方法。首先,为了避免使用成对数据,通过训练编码器和判别器,使编码器学习到输入图像的身份和视角的高级抽象特征,然后将这些低维数据输入生成器,通过训练生成器和判别器,使生成器重建出逼真的人脸图像。在测试时将多个代表视角的独热编码分别强加给身份表示,利用生成器将它们分别映射成高维数据,即可在保持身份特征的同时,生成多视角图像。其次,为了减少标签的使用数量,本文在模型中使用了半监督学习,利用极少数带视角标签的图像和大量无标记图像训练模型,将编码器训练成视角分类器,使其具有人脸图像视角估计能力。当输入无标签数据时,模型的低层部分对人脸视角进行估计,并将分类结果输入生成器指导图像的重建过程,解决了传统方法需要使用大量标签训练模型的问题。基于上述工作,本文提出一种基于生成对抗网络的半监督式人脸属性识别方法。传统人脸属性识别方法需要大量标签进行训练且模型难以达到稳定,本文将所提出的基于非成对图像的半监督式多视角人脸生成模型的低层部分应用于头部姿态估计和多视角人脸性别识别,通过对抗学习,解开人脸图像中的身份表示和属性表示,并通过编码器输出属性类别,达到人脸属性识别的目的。本文对以上提出的方法进行了充分的实验。实验结果表明,本文提出的方法在使用极少量视角标签的情况下,使用非成对图像对模型进行训练,在保持人脸身份特征的同时,生成了清晰真实的多视角人脸图像。同时,在人脸属性识别任务中,使用极少量标签训练的模型成功解开了人脸身份表示和属性表示。在头部姿态估计实验中,本文方法在CAS-PEAL-R1和Pointing’04两个数据集上的精确率分别为97.0%和94.1%;在多视角人脸性别识别的实验中,本文方法在CAS-PEAL-R1数据集上的平均准确率达95.0%。
其他文献
进入21世纪以来,由于化石燃料的有限性及其不断消耗造成的污染,提升了人们对可再生能源的关注。由于可再生清洁能源生产的不连续性,生产与消耗之间的时空差异,为实现其高效利
目的探讨当归补血汤含药血清对人脐静脉内皮细胞血管内皮生长因子(VEGF)受体表达的影响。方法将培养的人脐静脉内皮细胞(HUVEC)随机分为6组:①正常对照组;②100μmol/L H2O2低氧培养
分层教学是考虑个体实际情况,以人为本的教学模式。从多元智能的视角出发,探讨高职会计专业分层人才培养目标、搭建分层教学课程体系,并提出分层教学的实施保障措施,响应人人
以习近平为总书记的中国共产党第十八届四中全会上提出了全面依法治国建设社会主义法治国家的战略目标,培养大学生成为合格的公民是实现这一战略目标的重要途径。合格的公民
因缺乏统一的标准和平台,学校网络教学资源在建设和管理过程中出现了分散、重复、浪费的现象,资源"孤岛"使资源没有得到最大化的分享和有效的利用。本文利用.NET平台中成熟的
目前我国大气污染物SO_2的排放大户仍然是燃煤电厂,我国火电燃煤机组中使用率最高的脱硫技术是石灰石/石膏湿法烟气脱硫(WFGD),脱硫效率作为衡量电厂脱硫系统的重要指标,直接影响污染物排放量,因此明确脱硫系统中各参数变量对其的影响程度,对提高脱硫效率、减少污染物排放、制定故障检测预案具有重要的指导意义。随着信息技术在脱硫系统中的应用,脱硫系统在实际运行中积累了大量的历史运行数据,数据挖掘技术可以基
为研究不同微生物肥料对烤烟的影响,以2种不同微生物肥料为供试肥料,‘云烟87’为供试品种,对其生长势、田间农艺性状、抗病性、烟叶质量以及其主要经济性状进行比较试验。结
<正>原《人体轻伤鉴定标准(试行)》规定,外伤性鼓膜穿孔即构成轻伤,部分地区曾出现过鼓膜造作伤案例。新《人体损伤程度鉴定标准》相关内容将鼓膜外伤部分修改为"外伤性鼓膜
会议
以二氢高红霉素(去甲基阿奇霉素)为原料,经CbzCl保护、Swern氧化、环氧化、烯丙基胺开环氧和钯碳催化加氢五步反应以46%的总收率合成了泰拉霉素(纯度97%),其结构经液相色谱与
根据侦查讯问的具体任务和讯问活动的外在特征,可以把侦查讯问划分为六个不同环节,其中核心环节是态度转化环节和陈述引导环节。态度转化环节的任务包括四方面:控制情绪、改