论文部分内容阅读
近年来,随着监控设备和智能手机广泛应用的发展,基于内容的图像检索成为一种现实应用需求并获得了工业界、学术界的高度重视。在上世纪七十年代,主要是通过利用关键词进行图像检索,该技术需要人工手动标注文本关键词,以描述图像特征。它需要依赖人工对图像进行标注,需要较多的人力,且伴有主观性等方面的问题。尤其在人脸图像检索时,基于文本关键词文本图像检索技术显得很无能为力。上世纪九十年代以来,一种基于内容的图像检索(CBIR)开始变得流行。然而在近些年,由于一些信息系统所产生的图像速度飞速增长,基于视觉内容上的图像检索也开始成为一个重要的研究领域。由于自然光照,低分辨率和多姿态等构成了人脸特征提取的主要影响因素,目前基于自然光照场景,低分辨率和多姿态等多种自然混合条件下的研究仍是一个颇具挑战性的问题。本文采用多局部人脸特征融合方法,对人脸图像进行特征提取并得到人脸图像特征表示,然后借用聚类工具对人脸图像特征表示聚类,并对所有聚类进行性能评价,最后针对聚类的性能,选择不同聚类检索的方案,从而设计了一个具有准确和快速的人脸检索算法。本文主要贡献如下:1.收集一个完备的自然场景人脸检索数据集。人脸图像数据集为验证人脸检索算法好坏提供了充分条件,一个完整的数据集将会更全面地测试算法性能。在众多人脸图像检索实验中,FERET、BioID、LFW和ORL等图像集较为常用。但是,这些数据集中大多都是在正面人脸和特定光照下,在实际应用中不具有扩展性。在本论文中收集并整理一个更自然的数据集。其中学院监控视频录制了教职工、学生等人员在监控下的走动情况。该视频中,监控处于自然光照。学院监控视频的处理:对监控视频中变化的每一帧进行皮肤检测,椭圆检测,提取人脸,并处理和存储。具体来说,当下帧中得到的前景图像与背景帧图像之间是否有变化,一般认为有变化的时候就会有人的出现,如果变化程度达到某个阈值,认为这一帧中有人物出现,论文中利用当前图像帧减去背景图像,得到了变化的部分,并对这部分进行皮肤检测,椭圆检测,和使用Viola&Jones人脸检测算法人脸检测,然后使用最小矩形描述得到的不规则轮廓,同时,对每个不规则轮廓对应的最小矩形进行保存。这样做就最大可能地排除了自然环境下的非人脸区域。该数据集的整理均在Ubuntu系统下完成,约耗费30天,数据集中包含近一百个人,共计3167张图像,其中每一个人平均三十张图像。该数据集整理为验证论文中所述研究的可行性提供了良好的依据,也为以后的人脸检索研究贡献出一个数据集。2.采用光照补偿进行图像预处理。在数据集收集整理的过程已经使用过光照补偿。然而在人脸图像特征提取之前也使用了光照补偿预处理。在处理中首先对像素值进行按降序排序,并取降序排序后的图像像素中前百分之五像素值的平均值作为补偿因子,在此基础上对每一个像素值进行补偿,从而达到削弱光照影响的目的。3.局部特征提取并融合。考虑到仅凭借单纯一种人脸特征的人脸检索在检索效果上的不足,在本文中主要提出使用了HOG和LBP两种算法分别进行人脸图像特征提取并得到人脸表示,最后按照1:1的权重比例进行融合得到对应图像的基于HOG和LBP特征的自然场景人脸特征描述。4.聚类、聚类性能评价以及人脸检索。由于姿态和尺寸等影响导致类内对象较为疏远,造成人脸检索的漏检率较高。本文在局部特征提取和融合的基础上进行了人脸特征描述的聚类,保证同类对象间距离尽可能紧凑,类间距离疏远,与此同时,在检索过程中也就保证了检索的召回率,降低漏检率。在聚类中,本文选择完全相信聚类和半信聚类法进行聚类。最终针对非聚类,完全相信聚类和半信聚类进行比较,结果表明半信聚类优于非聚类和全信聚类,聚类优于非聚类。通过使用聚类提高了相似人脸的召回率和人脸检索的稳定性,与此同时,也保证了相似人脸检索的准确率。本文通过使用光照补偿的图像预处理,局部特征提取并融合以及人脸特征向量表示的聚类,在一个自然场景下的监控视频下所获取的数据集中进行人脸图像检索。首先光照补偿削弱了光照不足所造成的影响,特征的融合使得特征更加紧凑准确,特征向量表示的聚类在保证检索稳定性的同时,还提高了人脸检索的召回率和准确率。上述研究成果,在上班人脸签到,嫌犯追踪定位等诸多实际应用中,具有一定的研究意义和应用价值。