非可控条件下人脸识别中的若干问题研究

被引量 : 6次 | 上传用户:skykoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是图像处理、模式识别、机器学习等领域的经典问题。尽管目前已取得丰硕的研究成果,但当前的人脸识别技术都具有如下限定:(1)可控的图像采样环境;(2)被识别对象的主动配合。这些限定成为人脸识别技术发展和推广的最大障碍。然而,随着智能视频分析、人脸匹配、人脸图像搜索等应用需求的增长,人们对非限定条件下的人脸识别技术的需求日益增长。但是,非可控条件下的姿态、光照、表情和遮挡等复杂干扰因素可能导致人脸图像的类内变化远大于类间变化,这使人脸识别精度急剧下降而不能满足实际应用需求。本文以减少非可控条件下复杂干扰的影响为目标,围绕人脸识别系统中的人脸图像预处理、特征提取、相似性度量和判别分类等关键步骤展开研究,根据人脸识别任务的特点,针对每个关键步骤,提出减少复杂干扰影响的解决方法。本文的主要贡献如下:(1)提出了基于人脸图像预评估的自适应人脸验证方法。该方法首先按照预定义区域将人脸对分割成多个图像对。然后通过评估人脸对在关键点的图像梯度差异,自适应地选择人脸区域上的图像对。最后联合选出的图像对验证人脸对是否匹配。为了选择图像对,提出了三种图像对的可靠性评估方法:基于异常差异检测的方法、基于支持向量回归机的方法、基于堆栈自编码深度网络的方法。它们分别适用于对验证速度和验证精度要求不同的情形。实验表明,该人脸验证方法可以根据输入人脸对的遮挡、表情等视觉干扰条件差异,自适应地选择受干扰影响较小的人脸区域验证该人脸对。与仅使用全脸的方法和直接联合多人脸部件的方法相比,它可以有效减少局部干扰的影响。(2)提出了基于特征池化学习的高层人脸特征提取方法。首先提出一种新颖的特征池化学习算法。针对当前特征池化方法无法描述人脸结构信息且无法有效抑制局部噪音特征码,引入池化权重向量和线性变换矩阵两个模型参数,基于Sum-Pooling定义新颖的池化操作。并设计一个交替迭代优化算法学习该池化操作的模型参数,通过学习池化操作实现学习人脸高层特征。然后,将提出的特征池化学习算法应用于采用稀疏编码方法提取的局部特征,在不同大小的人脸图像块上学习人脸高层特征。最后联合所有图像块的高层特征形成人脸高层特征表达。实验表明,该方法可以提取不同层次的人脸结构高层特征,同时也可以有效地抑制局部噪音特征码。而且,提取的特征向量是低维的。(3)提出了基于视觉条件差异自适应调整的距离度量学习算法。首先利用人脸对齐检测的关键点位置关系和关键点上的局部特征,计算一对人脸关于姿态、表情、遮挡、光照的视觉条件差异。将这种与身份信息无关的视觉条件差异引入到特征空间的距离度量中,联合马氏距离定义新颖的距离度量。然后设计度量学习算法学习定义的新距离,并采用增广拉格朗日方法求解相应优化问题。优化过程同时学习特征空间中的马氏距离、视觉差异条件对马氏距离的影响及相应的调整规则。实验表明,在测试阶段,对于一对人脸图像,学习的距离度量能够根据它们的视觉条件差异,自适应地调整它们的特征向量计算的距离,从而有效地减小复杂干扰导致的类内变化。(4)提出了基于优化训练和组织多分类器的人脸验证方法。首先提出一种视觉一致性度量方法。然后分割成对的训练人脸图像,并利用视觉一致性度量方法优化组织分割的子图对,形成在不同人脸区域上、不同视觉一致性条件下的训练子集。接着融合多特征在每个子集上训练支持向量机分类器。每个分类器保存着特定人脸区域、特定视觉一致性条件下的分类规则。在测试阶段,根据一对人脸在全脸和人脸部件上的视觉一致性度量结果,自适应地选择分类器并优化组织它们执行判别。实验表明,该方法能够根据一对人脸在全脸和部件上的视觉干扰条件差异,自适应地调整分类判别规则验证该对人脸是否匹配,从而有效地减少复杂干扰的影响。
其他文献
主营产品:环保型手提式购物袋、冰袋、沙滩垫2005年阿里巴巴中国“十大网商”的称号,对于瑞尔国际实业有限公司的路天云来说,是一份特殊的荣耀,因为这个称号,不仅仅意味着在
以硝酸镁和尿素为原料,聚乙二醇为分散剂,用均匀沉淀法合成了氢氧化镁,并将其煅烧制得纳米MgO.讨论了反应温度、反应时间、反应物配比对氢氧化镁产率的影响.确定了合成氢氧化
<正> 如果说新中国书法教育事业的倡导者是潘天寿,那么陆维钊先生则是努力实践的先行者与奠基者了。一九六一年,潘天寿先生先后在文化部、在杭州召开的全国高等艺术院校教材
针对张家口洗煤厂原煤中粉煤含量增加,粗煤泥的分选效果变差影响精煤指标的情况,为降低粗精煤灰分,提高精煤回收率,采用CSS粗煤泥分选机替代螺旋分选机,对其进行工艺改造。介
目的分析体外反搏联合DHI对炎症因子产生的影响。方法研究对象为我院2015年2月-2016年4月治疗的114例ACS患者,在PCI术后应用DHI及体外反搏。结果术后第1 d的MMP-P9、IL-6、IL
不计其数的文学家都曾对音乐的描情叙景抒发了自己的感动和启示,甚至都认为音乐是自己作品的一部分。典型如罗曼·罗兰,他的小说结构浸透着音乐的素质,字里行间飘掠着透明而
目的:研究赖氨大黄酸(RHL)对D-半乳糖衰老模型小鼠的抗衰老和肾脏保护作用,阐明其作用机制,为RHL预防衰老的研究提供依据。方法:通过腹腔注射D-半乳糖建立小鼠衰老模型,将小
准备活动是进行某一具体活动之前所做的一些前期活动,目的是为了更好地完成某种活动。在学习某个单元之前或阅读某一篇英语文章或做某一项英语听力练习之前,英语老师一般会问
随着我国经济转轨和社会的变迁,公共危机的控制是政府应急管理工作的重要任务之一。而在互联网发达的当今世界,网络舆情的治理成为了公共危机管理的重要组成部分,其应对效果
房屋建筑工程造价指数是一种能够直白地反映建筑工程市场价格对房屋工程造价影响的指数,是指数在建设领域的一种延伸。它能够反映建设工程在不同时间段有关工程总造价和产品