【摘 要】
:
单目人脸重建和人脸识别任务均是近几年计算机视觉领域火热的课题,本文将两个任务进行结合,希望解决人脸重建的可识别性的问题。本文首先对经典的基于单张人脸图像的人脸重建
论文部分内容阅读
单目人脸重建和人脸识别任务均是近几年计算机视觉领域火热的课题,本文将两个任务进行结合,希望解决人脸重建的可识别性的问题。本文首先对经典的基于单张人脸图像的人脸重建算法进行了研究与实现,并在此基础上结合人脸识别算法,提高了人脸网格的可识别性,并且以重建得到的网格参数为人脸的特征向量,直接应用于人脸识别的数据集上可达到较高的精度。首先在经典的基于单张图像的人脸重建算法研究中,本文采用3DMM(3D Morphable Model,三维可变形的人脸模型)作为人脸的基本几何表示模型,选取了开源的增广300W-3D数据集作为训练集,并使用SphereFace卷积神经网络进行训练,对输入的人脸图像回归得到3DMM系数与相机参数,最后基于这些参数进行重建,并可视化重建的网格。本算法在不同姿态与表情的情况下具有稳定性。在基本的单张图像人脸重建算法的基础上,本文结合了人脸识别的算法,对3DMM的形状系数进行特征空间上的聚类,使得3DMM系数具有较高的可识别性。为了实现该需求,本文选取了多个不同数据集,并手动生成了部分数据集的标签来满足有监督的神经网络训练的要求。由于人脸识别与重建问题的收敛方向不一致,训练过程中网络难以收敛,因此本文针对性的设计了CNN网络结构,并拆分训练步骤为多个阶段,每个阶段会针对性的锁定前几个步骤已经预训练完成的模块,并预训练网络中的另一个模块,最后开放网络中的所有模块同时进行训练。并且本文设计的损失函数结合了人脸重建与识别的任务,并解决不同训练图片具有不同标签的问题,使得整个网络最终能够收敛,且达到较高的精度。本文设计的人脸重建与人脸识别的联合学习算法在AFLW2000-3D数据集上与业界领先算法相比,达到了与之相近的精度,在MICC人脸重建数据集上达到了1.85mm的RMSE成绩,在人脸识别数据库CFP-FP,AgeDB,LFW和YTF上分别达到了95.10%,90.30%,99.32%,96.66%的准确度,验证了本文算法的有效性。
其他文献
金属间化合物通常以第二相强化方式提升镁合金的力学性能,却导致合金的散热性能降低。这一矛盾的根本机制—金属间化合物种类及含量对合金热导率的影响机理尚未清楚,限制了高
无线传感器网络是一种分布式信息采集网络,由于具有成本低、数据传输灵活、环境适应性强等优点,在军事、民生、经济等领域均有着至关重要的地位。近些年,一种基于能量采集的无线传感器网络开始成为研究热点,其网络节点中搭载了能量采集模块,能够对周围环境中的绿色能源进行采集并作为节点可用能量,有效地解决了传统无线传感器网络寿命有限的问题。尽管该技术可通过能量采集近乎“无限”地提升节点寿命,但却带来了节点可用能量
多西他赛(DTX)是一种化疗药物,可以通过抑制微管的解聚及使细胞周期阻滞发挥治疗作用,目前在临床上常被用于治疗转移性乳腺癌。乳腺癌是对当今女性的健康带来了严重影响的一种癌症。DTX作为一种治疗乳腺癌的化疗药物,其水溶性差,使用时需要添加增溶剂吐温80,但这种增溶剂会引起严重的过敏反应及其他不良反应,对机体正常细胞的损伤很大。因此,制备一种纳米载体选择性的将DTX运输到病灶部位来减少DTX用药时的副
环丙氨嗪是一种三嗪类化合物,作为饲料添加剂被广泛应用于畜牧养殖业。它在环境中具有迁移性,可以进入人体内,对人体健康产生影响。环丙氨嗪在动物和植物体内可通过脱烷基作
近二十年来,各国的肿瘤发病率和死亡率都呈现逐年上升的趋势,使之成为威胁人类健康和亟待解决的恶性疾病。随着生物技术的快速发展,包括生长因子、细胞因子、抗体和酶在内的一系列治疗性蛋白或多肽已被成功开发出来。同时,蛋白质治疗因其具有药理作用强、低毒等特点,在各种疾病的治疗中显示出巨大的潜力。然而,由于其稳定性低、蛋白酶易降解和跨膜转运能力差,蛋白质的有效生物利用度和临床应用仍是一个巨大的挑战。为了解决这
埋地管线系统是天然气运输的重要方式。由于跨越多种地质单元,管道与活动断层往往在空间上共存,因此管道的活动断层破坏风险不可避免。天然气破坏的另一个重大风险来自管道自
自中共十八大以来,习近平一直高度重视思想政治教育工作。以习近平为核心的党中央对高校思想政治教育作了一系列新的论述。它涉及了思想政治教育在人才培养中的重要性,以及如何加强高校思想政治教育等诸多问题。插画因其有趣的表现形式和丰富多彩的内容备受大学生的喜爱,大学生群体是当代接触插画作品最多的群体,插画作品对当代大学生的认知行为、道德取向和价值选择具有重要影响。然而传统的思想政治教育具有模式单一化、活动方
我国是苹果生产和消费大国,且苹果种质资源丰富,但是我国苹果产业品种单一,缺乏加工型苹果品种。因此培育出加工型苹果新品种对我国苹果产业和苹果深加工产业的发展具有重要
科技改变生活。如今,在科技共享的主题下,跨国交流越来越频繁,语言因此成为一大阻碍。如何克服语言障碍,确保高效沟通成为研究的重点。本文是一篇模拟口译实践报告,首先对材料的背景信息、口译和同声传译的定义及发展、顺句驱动和信息重组策略的定义及应用的必要性进行阐述。以2019年谷歌开发者大会作为研究材料,以顺句驱动策略为主、信息重组策略为辅进行口译,从单词、短语、句子三个层面深入分析口译过程中在陌生词、介
在阅读过程中,读者不仅能够从中央凹获取信息,还能够从副中央凹获取信息,如副中央凹词的语音、语义和字形等信息,使得读者注视该词时的加工时间减少,这被称为副中央凹预视效应,副中央凹信息加工能力是影响读者阅读效率的重要因素。对汉语阅读的相关研究表明,读者能够从副中央凹词N+1中获取字形和语义信息,而对语音信息在汉字加工中的作用和发生阶段尚存争议。随着年龄的增长,老年人的阅读效率降低,出现阅读困难的现象,