基于RGB-D的人脸识别

来源 :山西大学 | 被引量 : 5次 | 上传用户:ospriteo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸图像识别可以称为计算机视觉领域的一个经典的研究课题,其本质是图像分类。识别率是人类不断追求的目标。由于传统的人脸识别存在很多问题,比如光照变化、头部姿势变化、异物遮挡等。目前虽然有很多方法解决这些问题,但是总是存在这样那样的条件限制。针对这些问题我们提出了一种基于RGB-D的人脸识别方法。这里我们借助Kinect获取彩色和深度图像。此方法主要解决了两个问题,即头部姿势变化和光照变化。我们通过使用随机森林算法根据不同的头部姿势将图像分集处理,这从一定程度上解决了因姿势变化而导致识别失败的问题。然后我们巧妙的利用了红外线本质上不受光照变化的影响,采用kinect获取的深度图像进行人脸识别也在一定程度上有效的解决了光照变化的问题。我们主要的研究工作有:首先从Kinect获得一个具有广泛的头部姿势变化、光照和面部表情变化,太阳镜伪装和用手遮挡等不同条件下的RGB图像和Depth图像。然后将获取到的同一个人在不同条件下的多个图像看作一个图像集。其次利用k-means类聚算法对已获得的图像进行背景分割处理,然后采用随机森林算法做头部姿势估计并且利用我们自己的算法进行脸区域检测和裁剪。最后根据随机森林算法估计出的头部姿态将一组脸部图像集分成多个子图像集。对于分类,我们提出了基于块的协方差矩阵表示图像模型在黎曼空间中的一个子图像集的方法以实现降维。并使用SVM模型分别学习每个子图像集,然后将所有子图像集的结果相融合得出最终的识别结果。最后我们借助Biwi Kinect数据库设计实验论证了本文所提出的方法。此算法已经在包含不同条件下超过5000幅RGB-D图像数据集中进行了评估。实验证明,我们的算法可实现高达98.84%的识别率。
其他文献
作为体现当前汉语辞书研究最高水平的大型工具书,<汉语大词典>由于各种原因在义项、书证、释义等方面仍存在一些缺憾之处.建国以来,在楚地和秦地出土的大量简牍文献,尤其是其
创业失败给创业者的情绪和经济带来沉重的打击,使得创业者在再创业过程中对风险感知行为发生变化:一种是可能变得更谨慎小心;另一种可能由于经验经历的增加变得更为自信。本
培养企业员工自主学习的兴趣,可以从员工自身的职业生涯规划与企业长久发展相适应,做到人职匹配的原则,使企业的发展和企业员工各人理想的职业生涯目标相统一。优秀的企业文
肝素非抗凝的药理作用研究进展尚丽,周序斌,张黎华(山东医科大学药理教研室,济南250012)肝素为一族天然糖胺聚糖(glycosaminoglycans,GAGs),属线性聚阴离子电解质。正常机体几乎所有组织都含有肝素,但主要存在于血管
目的:①调查阻塞性睡眠呼吸暂停低通气综合征(Obstructive Sleep Apnea Hypopnea Syndrome OSAHS)患者中高血压患病率情况,并与对照组(排除了OSAHS的受试者)相比较,研究OSAHS患者
目的:探讨白三烯受体拮抗剂(leukotriene receptor antagonist,LTA)—孟鲁司特治疗中重度稳定期慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)的临床疗效。
为探究电场稳定性对测量纳米颗粒溶液Zeta电位的影响,对主流的U型样品池进行电场仿真实验;根据仿真结果发现的U型样品池底部的电场强度分布存在不均匀的问题,选取U型样品池两
采用DEA-Malmquist指数,从多投入多产出角度测算了我国大中型工业企业技术创新全要素生产率(TFP),并分解为技术进步和技术效率来研究。发现全国技术创新TFP增幅仅为2.3%,按区
快时尚品牌服装门店需要根据不同的消费受众、消费心理以及消费行为采取不同的搭配展陈设计。品牌需依据目标消费群体而营造相应的服饰搭配与空间展陈,对于收入、受教育程度
电子商务作为一种新的经济形式 ,需要构建完善的法律体系以促进其发展。我国电子商务发展迅猛 ,但与之配套的法律却跟不上节拍。在电子商务立法方面 ,作为全球因特网发源地之