人脸偏振热红外—可见光图像翻译研究

来源 :安徽建筑大学 | 被引量 : 0次 | 上传用户:du_info26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于可见光成像的人脸识别技术近年来得到快速发展,但在照明不足情况下,成像质量受到严重影响,存在模糊不清和局部阴影等问题。由于独特的波段特性且具有夜间可成像及不受环境光照影响的特点,热红外成像成为当前人脸识别领域发展的新方向;但因成像波长较大,热红外图像仍存在分辨率低、细节不清、边界模糊等不足,人脸识别精度不高;另一方面,现有人脸识别数据库多采为可见光图像,与热红外图像存在较大的模态差异,难以将热红外图像直接应用于现有人脸识别数据库,进而限制了该项技术的实际应用。随着深度神经网络的快速发展,图像翻译领域取得了巨大成功,使得将热红外图像翻译成可见光人脸图像(类可见光图像)后利用现有可见光人脸识别技术进行识别并投入实际应用成为可能。但在翻译过程中,由于热像取决于人脸温度信息、忽略了面部几何特征,因此,图像翻译后获得的类可见光图像与实际通过可见光相机获取的图像还存在较大差异。针对上述问题,本文在热红外成像过程中引入偏振探测技术,利用偏振成像获得人脸自发辐射Stokes参量间的冗余信息进行图像融合,并通过生成对抗神经网络提取融合后的图像实现偏振热红外向可见光图像的翻译。具体研究内容如下:(1)人脸红外图像偏振成像增强。在介绍红外光的基本概念基础上,基于红外自发辐射传输理论,研究了人脸自发辐射的机理,探讨了热红外成像存在的不足;在红外热成像中引入偏振探测技术,搭建偏振成像系统采集偏振热红外人脸热像与可见光图像,通过图像裁剪与对齐处理后构建偏振热红外人脸图像数据集;分析了人脸偏振热像局部二值模式(LBP)特征、高斯差分边缘(Do G)特征和方向梯度直方图(HOG)特征,结果表明,偏振探测技术对热红外图像几何特征与纹理细节具有较好的增强作用,能够凸显嘴巴、鼻子、眼睛等区域的纹理细节及面部边缘和轮廓。(2)基于颜色空间的偏振热像融合方法。首先对红外偏振热像进行均值滤波处理,然后基于Stokes参量从不同方面反映人脸信息并与RGB色域三个独立通道具有良好的对应关系,以高斯差分处理后的图像作为权重,将I、Q、U参量图像通过组合变换映射到RGB颜色空间进行融合以突出人脸特征;构建基于支持向量机与方向梯度直方图的偏振红外热像人脸识别算法(HOG-SVM),验证融合图像对于人脸识别性能的提升作用。结果表明,基于RGB空间融合的红外偏振热像的图像熵、结构相似性相对原图像有较大提升,HOG特征相对于可见光人脸图像更接近;基于HOG-SVM算法,融合图像相对I、Q、U、DOP等图像具有较高的识别率。(3)基于生成对抗网络偏振热红外-可见光人脸图像翻译方法。首先介绍了人脸翻译的基本概念,然后介绍生成对抗网络的模型结构、数学原理以及它的训练过程,并对如何改进生成对抗网络进行了说明。在此基础上,通过有监督和无监督学习分别介绍基于生成对抗网络的图像翻译技术,并利用本文数据集对图像翻译技术进行了评估。结果表明,基于有监督学习的网络Pix2pix图像翻译人脸器官位置基本与可见光图像基本一致,不存在较大偏差,虽有部分区域模糊,但是整体效果相对较好。(4)基于改进的Pix2pix偏振热红外-可见光人脸图像翻译方法。针对偏振热红外图像的特征,引入MSE损失函数和特征重建损失函数,在保持良好结构相似性的同时捕捉偏振热红外图像的细节纹理信息,并在网络中加入实例正则化,使生成图像之间具有多样性和独立性;通过构建的偏振热像人脸数据库对提出的算法进行验证。结果表明,本文提出的人脸翻译框架保持了图像的结构相似性以及有效学习了图像的深层次特征,能够有效增强翻译后的类可见光人脸图像纹理细节,在主观和客观二个方面,相对其他框架都具有更好的效果,在图像特征分布上接近真实可见光图像。图[35]表[8]参[64]
其他文献
分析质量控制的实质是闭合系统的信息反馈控制。准确度和精密度的控制是质控的两大主干。质控图是分析质量动态变化的必要形式。在大批量土样的微量元素分析中,采用实验室之间的对比、使用标准参考土样、控制回收率等来保证准确度。精密度的控制则采取实验条件的同一、空白和平行试验、密码抽查、自检及互检等。检出了个别元素的分析质量偏差并加以纠正。
期刊
本文研究了超高压处理对大豆拉丝蛋白特性的影响,以达到改善其再加工特性的目的。实验利用不同超高压处理条件(200 ~ 600 MPa,10 ~ 30 min)对大豆拉丝蛋白进行处理,采用傅里叶变换红外光谱、紫外吸收光谱和内源荧光光谱分析超高压对大豆拉丝蛋白结构的影响,并通过持水力、表面相对疏水性、游离巯基含量的变化研究超高压对大豆拉丝蛋白功能特性的影响。结果表明:随着压力和时间的增加,β-折叠、无规
基于Landsat遥感影像,提取蒙古高原2000—2020年每年1 km2以上湖泊面积信息,分析其时空变化特征。结果表明:2009年之前湖泊面积和数量呈减少趋势,2009年之后呈增加趋势,整体上2000—2020年湖泊面积和数量呈减少趋势;不同等级湖泊变化差异较大,特大型和中型湖泊变化相对稳定,大型湖泊减少幅度最大;不同区域湖泊变化也不同,西北部湖泊变化较稳定,中东部湖泊变化较剧烈;研究区湖泊空间
随着互联网平台过度收集、违规使用消费者金融信息等事件频繁发生,加强金融监管及保护消费者金融信息安全成为亟待解决的热点问题。将前景理论和心理账户结合引入互联网平台和监管部门的博弈决策过程,构建双方演化博弈模型,并对相关影响因素进行仿真分析。结果发现,影响金融信息安全系统达到理想状态的关键在于互联网平台和监管部门的价值感知;强化第三方监督有助于促进监管部门强化监管以及改善互联网平台金融信息安全治理;成
提升系统的安全可靠运行对整个矿井的生产至关重要。因此要实现矿井提升系统的单点全域可视化与虚拟远程协同联动控制,解决传统多点视频监控只能覆盖个别关键部件,信息获取不全面的难题。针对上述问题,结合工业传感、人工智能、快速建模、云存储等技术构建了集监测、控制、服务等功能于一身的矿井提升系统数字孪生框架,并以此为基础,提出了多维多尺度数字孪生快速建模方法:通过三维激光扫描技术与滤波、泊松三维重建等点云处理
近年来,我国数字经济快速发展,但传统意义上的营商环境难以满足数字经济时代要求,构建新型数字经济营商环境成为社会日益关注的问题。本文在剖析数字经济营商环境涵义基础上,阐述了传统营商环境治理成效以及优化数字经济营商环境的现实意义,指出数字经济营商环境现存问题,提出从完善市场准入管理、重视知识产权保护、加强数字空间治理、推动数字经济监管创新、强化数字营商环境评价等方面重点发力,持续打造数字经济新型营商环
我国著名的文化典籍《西游记》家喻户晓,存在众多的英文译本。作为中国古典文化小说,《西游记》中的文化负载词数量多、范围广、含义杂,在翻译的过程中需要格外重视。在对中国知网(CNKI)收录的发表于2012~2020年间的12篇与文化负载词翻译研究相关的论文进行整理发现,目前现有的研究存在研究力度不够、研究视角狭小、译本研究单一等问题。
现代信息化教学需求冲击着传统的高职教师口语教学模式。提升高职教师口语课程教学质量和建设成效,需要在充分挖掘SPOC混合式教学模式优势的基础上,持续加强SPOC教学平台设计,深入开展教学实践,进行教学效果的有效性分析。
采用熔化极惰性气体保护焊(MIG)、非熔化极惰性气体保护焊(TIG)和激光填丝焊(LBW)对6008-T7铝合金进行了焊接,并对焊接接头的拉伸性能、弯曲性能、微观组织和断口形貌进行了检测和分析。结果表明:三种焊接接头均具有良好的弯曲性能,拉伸试样的断裂机理均为韧性断裂。并且激光填丝焊焊接接头的焊缝区、熔合区晶粒更加细小,力学性能最佳。