【摘 要】
:
人脸表情识别技术是一个涉及到心理学、生物学、计算机学等等多门学科的交叉产物,由于人脸表情识别研究具有极高的应用价值和研究意义,近十年来,一直是人工智能领域的一个研究热点。得益于硬件技术的提高和深度学习技术的发展,人脸表情识别研究对象已经从实验室控制表情样本转移到了自然场景表情图像,同时也促进了人脸表情识别相关应用市场的蓬勃发展。反过来讲,迅猛发展的应用市场又对人脸表情识别研究提出了更高的要求,例如
论文部分内容阅读
人脸表情识别技术是一个涉及到心理学、生物学、计算机学等等多门学科的交叉产物,由于人脸表情识别研究具有极高的应用价值和研究意义,近十年来,一直是人工智能领域的一个研究热点。得益于硬件技术的提高和深度学习技术的发展,人脸表情识别研究对象已经从实验室控制表情样本转移到了自然场景表情图像,同时也促进了人脸表情识别相关应用市场的蓬勃发展。反过来讲,迅猛发展的应用市场又对人脸表情识别研究提出了更高的要求,例如:环境约束少、计算速度快、小型便携等等。总之,研究更加快速方便的自动人脸表情识别技术,不仅是和谐人机交互、人工智能等发展的必然需求,也是相关应用市场迅速发展的必然要求。本论文旨在研究一种自然场景下快速人脸表情自动识别技术,主要针对其中一些关键技术进行了研究。本论文的主要研究内容和创新性工作归纳如下:一、快速准确的图像噪声强度检测技术。由于图像传感器设备固有缺陷,数字图像不可避免含有噪声,图像噪声不仅可能导致后续的人脸检测失败,而且会降低表情识别的准确度,所以,必须要对图像进行噪声强度检测,以明确图像质量是否需要去噪,并且为去噪程序提供必要的参数。现有的快速噪声强度检测技术容易对低噪声图像过估计,尤其是复杂背景图像,因而不能满足适应各种自然环境的需求。本论文提出了一种基于主成分分析(Principal Component Analysis,PCA)技术和主纹理图像区域的快速精准图像噪声强度估计方法,该工作主要有两个创新之处:(1)对基于主成分分析的噪声强度估计思想进行了深入剖析,针对传统PCA噪声估计方法不够精准的问题,建立了真实噪声强度、图像块大小、构建协方差矩阵图像块数量以及最小特征值四者之间的数学关系模型,从而能够利用最小特征值更加准确地计算图像噪声强度;(2)传统方法都是选择平滑(均匀)图像块来估计噪声强度,基于采样图像块样本越多越好的原则,本文方法创新性地选择主纹理图像区域估计噪声,因而本文方法不仅能够适应各种复杂环境图像,而且性能更加稳定。二、基于Gabor卷积网络的快速高效人脸表情识别技术。人脸表情的变化主要体现在眼睛、眉毛、嘴和鼻等丰富纹理区域,称之为感兴趣区域。Gabor特征是一种可以用来描述图像纹理信息的特征,Gabor滤波器的频率和方向与人类的视觉系统类似,特别适合用于纹理表示与判别,因而Gabor技术广泛应用于人脸表情识别领域。Gabor 卷积网络(Gabor Convolutional Network,GCN)融合了Gabor技术和传统卷积神经网络(Convolutional Neural Network,CNN)的功能,兼具了两者的优势,既能够有效检测纹理丰富区域,又能够通过反向传播技术学习最优系数。相比于传统CNN,GCN更擅长提取脸部感兴趣区域的特征,也就是说,GCN能够以较少的卷积单位和层次获得足够的人脸表情特征。因此,本论文设计了一个非常轻量化的GCN模型用于人脸表情识别任务,它的主要优势在于:(1)该GCN模型具有非常高效的表情特征提取能力和良好的表情识别性能,能够媲美人脸表情识别领域广泛采用的VGG16、ResNet18等著名CNN结构,甚至在有些数据集上比它们更优秀;(2)该GCN模型结构非常简单,仅含有四个卷积层和两个全连接层(包括Softmax层),因而,计算复杂度低,参数量少,对计算资源、存储空间资源需求少,比传统CNN更加适合资源有限的小型设备。三、采用等角度固定权值的改进Softmax损失函数(Advanced Softmax Loss,ASL)。Softmax损失函数(Softmax Loss,SL)是人脸表情识别领域应用最多的一种监督函数,SL使不同类别的特征在角度域尽量分开,在SL监督下学习的深度特征的区分度不够好,因而,一些用于提升特征区分度的嵌入(Embedding)相继被提出来。提升深度特征区分度的基本原则是减小同一类特征之间的变化和增大不同类特征之间的距离,不同类特征之间的角度距离应该越大越好,本论文从最小化所有类间夹角的余弦值之和出发,推导出所有权值夹角的余弦值等于1/(1-n)(n是表情类别数量)是一种理想情况,基于此,提出了一种采用等角度分布固定权值的改进Softmax损失函数。ASL在一定程度上缓解了SL常常压缩少样本类角度空间的问题,同时也使得不同类特征之间的角度距离尽可能大,所以,相比于传统SL,ASL在准确度和可靠性方面都有着显著的提升。四、结合本文提出的一些相关技术,设计了一个自然场景下快速人脸表情识别系统,并在NVIDIA的Jetson AGX Xavier边缘计算设备上部署测试。该系统处理一张640 × 480 RGB彩色图像耗时大约0.3秒(采用GPU加速时大约0.1秒),处理速度比一些其它的表情识别系统快得多。
其他文献
随着计算机科学技术的飞速发展,肿瘤放疗进入到了一个精准治疗的时代。图像引导放疗可以在提高放射剂量杀死肿瘤组织的同时,有效保护肿瘤周围的正常组织,极大提高了患者的生存率和生存质量。放疗中,肿瘤专家和放疗物理师需要对肿瘤靶区和临近风险器官进行精确勾画,从而可利用计划系统进行放射治疗仿真,获得患者在理想状态下的受剂量。利用计算机作为工具,并结合有效的医学图像分割算法,实现肿瘤和风险器官的高效、自动化分割
近二十年来,不确定多智能系统的一致性控制问题已经成为控制科学研究领域的一个热点问题,尤其是基于逼近器的分布式控制受到了学者们的广泛关注,获得了大量理论研究结果,但是仍然有一些公开的问题值得进一步的研究和讨论.本文将针对已有工作中广泛存在的全局一致性控制问题进行研究.研究思想来源于单个系统全局稳定性,万能逼近器作为一个前馈补偿器来描述不确定非线性动态,依靠领导者信号作为输入信号来逼近不确定非线性动态
Web 2.0时代的到来,在线社交网络应用迅速普及,大量用户涌入在线社交网络平台发表见解、分享生活,产生了大量用户生成内容。这些数据对于提高搜索服务的质量与体验具有重要意义。在此背景下,旨在利用社交网络数据优化搜索结果,提升搜索服务用户满意度的社会化搜索引擎应运而生。然而,已有社会化搜索引擎研究仍然存在4个问题:(1)检索资源大都集中于特定的在线社交网络平台,导致信息检索查全率不高;(2)被动响应
大数据时代的到来不仅给数据的处理速度提出了更高的要求,也让价值信息的安全存储成为了重要挑战。忆阻器有着简单的器件结构、简洁的制备工艺、较低的功耗以及较高的集成度,对于实现海量数据存储、克服冯·诺依曼瓶颈、构建存算一体式计算模式具有重要意义。与此同时,物理瞬态形式的电子器件能够在外界的刺激触发下实现物理形态和器件功能的部分或全部消失,其在绿色电子,可植入医疗以及安全电子等领域具有重大的应用价值。因此
网络构成了复杂系统的基础,从脑网络到计算机通信网络,从运输基础设施到在线社会系统,从生物系统到金融市场;在现实世界中,所遇到的大多数系统都是复杂的系统。这些系统具有复杂的拓扑特征,这意味着它们在元素之间的连接拓扑结构既不限于对称排列,也不是可预测的(纯随机的)。学者将这些系统称为复杂的网络。复杂的网络代表着无数的现实世界系统,其中部分系统是人造的,一个较为常见的例子即为Internet和语义Web
电离层化学物质释放是电离层理论研究的重要组成部分,是人工调控和应用电离层空间环境的有效手段之一。本文基于电离层不稳定性理论,研究了电离层化学物质释放的不稳定性效应,并有针对性的讨论了影响电离层不稳定性发展的关键因素。利用线性增长率理论可以从原理上分析化学物质释放的不稳定性触发效应,但线性理论对应不稳定性发展的早期阶段,只能部分判断电离层不规则体的形成概率。因此,需要能够反映不稳定性线性和非线性阶段
人类社会发展史表明,每一次依人类智慧和文明的进步而发生的科学技术革命,都在不同程度上推动人的存在方式变化与人类社会发展。进入二十一世纪后,以人工智能、大数据、云计算、区块链和新一代通信网络信息技术为代表的新技术革命的融合和发展,推动人类社会进入了一个被称为“工业4.0”的第四次工业革命时期,我们正处于这一历史阶段。“现实”就是人与人类的当下的存在,就是我们的本质在当下的显现。从科学技术革命对于人类
近年来,随着电子设备功能和性能的不断提升,电子设备的体积越来越小,装配的元器件数量越来越多,器件运行功率越来越大,导致热流密度和安装密度急速攀升。因此,对电子设备的热控制能力提出了越来越高的要求。微通道换热以其结构紧凑、换热效率高、工程实现性好等诸多优点,作为一种高效的换热形式被海内外研究者们广泛关注。微通道换热结构形式多样不胜枚举,以蛇形微通道换热结构和带有翅片的微通道换热结构散热效果最理想。本
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像技术凭借其全天时、全天候以及高分辨的独特优势,在军事和民事领域都扮演着重要的角色。ISAR通过对空间、空中和海洋目标进行高分辨成像,为非合作目标的分类和识别提供了有力的技术支撑。为了满足越来越丰富的应用需求,ISAR正朝着多功能、多维度和精细化的方向发展。工作模式和系统结构的多样化,以及目标运动的复杂化
汽车数量的迅速增加导致全球能源消耗和温室气体排放量不断增大,如何减少能源消耗和碳排放量成为汽车工业面临的一个重要挑战。诸多学者正致力于研究的以减小车辆能耗为目的的新技术主要专注于对车辆本身的改进和控制,而把道路坡度作为影响车辆能耗的外部因素。不同于现存的许多方法,本文从优化道路坡度的角度研究降低车辆能源消耗的方法和技术。本论文主要贡献如下:本文提出了在车辆按照既定速度曲线行驶的条件下减少其总能耗的