面向异构人脸识别的跨模态度量学习研究

被引量 : 0次 | 上传用户:xb_wonder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构人脸识别是指待比对识别的人脸图像来自两个不同模态的人脸识别,如近红外图像与可见光图像人脸识别,素描与真人照片的人脸识别,低分辨率与高分辨率图像人脸识别等,本文重点研究了异构人脸识别中的跨模态度量学习问题,针对带有模态干扰的异构人脸特征表示,学习距离度量,消除模态的干扰,使得跨模态人脸的同类与不同类距离可分。具体的,针对异构人脸识别应用中跨模态度量学习的不同问题,本文主要提出了以下的四个创新方法:(1)提出了一种基于间隔的跨模态度量学习方法(Margin Based Cross-Modal Metric Learning,简称为 MCM2L)。针对异构人脸识别中,受模态干扰的影响,跨模态同类距离与跨模态不同类距离不可分的问题,提出了一种最大化跨模态三元组距离约束中同类与不同类距离之间的间隔的方法。具体的,采用的度量函数为基于公共子空间的跨模态度量函数,可以对两个模态下的特征找到一个公共子空间,在公共子空间中对特征进行距离度量,学习该度量函数的目标包括两部分,第一部分是最小化跨模态同类样本对的距离,第二部分是约束跨模态三元组中的同类样本对的距离小于不同类样本对的距离一个间隔,该方法可以更关注于优化那些同类与不同类样本距离不可分的样本。所提的方法还被进一步扩展为基于核的方法(Kernelized Margin Based Cross-Modal Metric Learning,简称为KMCM2L)来处理数据非线性可分的问题。所提出的方法在三个异构人脸数据集上进行了测试,验证了所提算法相对于基准算法能取得更优的识别效果。(2)提出了一种基于AUC优化的跨模态度量学习方法(Cross-Modal Metric Learning for AUC Optimization,简称为CMLAuC)。已有的度量学习方法关注于最小化定义在同类和不同类样本对上的距离损失,而通常在异构人脸数据集上,能构造出的同类与不同类的样本对的数量是严重不均衡的,在数据分布不均衡的情况下,采用AUC(Area Under the ROC Curve)指标更具有实际意义。因此,提出了一种优化定义在跨模态样本对上的AUC的跨模态距离度量方法,该方法被进一步扩展为可以优化部分AUC(partial AUC,简称为pAUC),pAUC是在一个特定的假阳率范围内的AUC,这对于一些要求在特定假阳率范围内有较好性能的应用尤其有用。所提算法被建模为一个基于对数行列式正则化的凸优化问题,为了快速的对所提的算法进行优化,提出了一种小批量邻近点优化算法,每轮随机采样一部分的跨模态同类样本对以及跨模态不同类样本对进行优化。所提算法在三个跨模态数据集以及一个单模态数据集上进行了测试,证明了该算法能有效提升基准算法的性能,此外,基于pAUC优化的度量在一些评价指标,如Rank-1,VR@FPR=0.1%上取得了更好的效果。(3)提出了一种稀疏跨模态度量集成学习方法(Ensemble of Sparse Cross-Modal Metrics,简称为 ESPAC)。异构人脸识别中,除了模态不同带来的干扰,人脸图像上通常还存在着很多其它的干扰因素,包括,遮挡,表情变化,光照变化等,针对该问题提出了一种可进行特征选择的跨模态度量学习方法。具体的,首先给出了一种弱的跨模态距离度量学习方法,可以在两类跨模态三元组上学习秩为一的跨模态距离度量,同时进行基于组的特征选择来消除人脸特征中的噪声特征(对应于遮挡,表情变化,光照变化等);通过集成学习的方法来学习一系列可相互补充的弱距离度量,并将它们集成为一个强距离度量。实验证明所提算法在有强遮挡的情况下,可以有效的通过特征选择来提升性能,此外,在三个异构人脸数据集上,证明了所提算法相较于基准算法能有更好的识别效果。(4)提出了一种干扰鲁棒的跨模态度量学习方法(Variation Robust Cross-Modal Metric Learning,简称为 VR-CM2L)。该方法针对解决了漫画人脸识别中度量漫画与照片距离的问题,漫画人脸识别是一种特殊的异构人脸识别问题,识别过程会受到各种干扰因素的影响,与漫画相关的干扰因素包括面部特征夸张,绘画风格变化等,其它干扰因素包括视角变化,表情变化,光照变化等,这些干扰因素使得漫画特征与照片特征之间存在严重的误配准。针对该问题,提出了一种干扰鲁棒的跨模态度量学习方法。具体的,提出了一种特别设计的基于人脸关键点的异构特征抽取方法,照片人脸特征在固定视角以及尺度的人脸关键点周围抽取,漫画特征在同样的人脸关键点周围,在不同的视角以及不同尺度下抽取。为了度量这样的异构特征表示之间的距离,在每个人脸关键点处学习一个跨模态度量,该跨模态度量中采用了距离池化的方法来对齐每个关键点处漫画的多个特征与照片的单个特征。最终漫画与照片之间的距离是所有基于关键点的距离度量的组合,为了保证学习得到的组合度量的全局最优性,所有的基于人脸关键点的跨模态度量是在一个统一的优化框架下学习的。在两个漫画数据集上验证了所提方法在各种干扰情况下的有效性,同时验证了所提出的异构特征抽取方法与VR-CM2L结合,相较于同构的特征抽取方法取得了更好的效果。
其他文献
目前中国学生的“美音热”反映出美国文化对中国的影响,也折射出中国学生学习外语的心态。本文从对本校学生语音情况调查着手,分析了学生崇尚美音的内外因素。作者认为,“美
期刊
文章从20世纪下半叶的音乐文化倾向及音乐语言特点,音乐作品的构成特点及常规类型,音乐作品构成的基本参数,其他流派及结构特点四个方面论述了20世纪下半叶音乐语言特点及结
人口健康是以人为本的社会可持续发展的基本保障。我国有13亿人口,对生物医用材料市场需求巨大。近10年来,在国家的重视和持续支持下,在生物医用材料研发方面取得了一定成就
韵律音系学是当今生成音系学的一个主要分支理论,主要研究语言的重音和节律现象,旨在阐释其中的内在联系及规律。本文就该理论的产生与发展进行了比较全面的概观,指出其中各
本文分四个部分。第一部分提出开展本课题调查研究的原由及问卷设计的具体情况。第二部分介绍本次调查运用的方法、统计的程序 ,以及被试的情况 ;第三部分对调查结果加以分析
<正>热塑性聚氨酯弹性体(TPU),以其优异的环保性、简便的加工性和良好的物理性能,在中国得到了迅猛的发展。
家庭教育是伴随我们终生的一种实践活动。家长作为我们人类社会化的第一任老师,他们的任务不仅仅是要教育子女怎样生存,更重要的是教会孩子怎样做一个合格的社会人。一个人的
批判性思维因其批判性、反思性、理智性、严谨性而备受推崇,被认为是21世纪学生最应该具备的思维方式之一。美国明确将学生具备批判性思维的习惯与能力作为其中学科学教育的
案例教学法是在管理学教学中颇受重视并普遍推行的一种教学方法。本文通过分析管理学案例教学中存在的问题,提出适合培养创新型经济管理人才的案例教学若干对策。
随着城镇化和经济技术的发展,垃圾的产生量与日俱增,垃圾处理成为了人们关注的话题。卫生填埋是目前各国处理生活垃圾的主要方法。卫生填埋的主要限制因素是在垃圾填埋过程中