基于HOG和LBP特征的自然场景中人脸检索技术研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:ananluo2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着监控设备和智能手机广泛应用的发展,基于内容的图像检索成为一种现实应用需求并获得了工业界、学术界的高度重视。在上世纪七十年代,主要是通过利用关键词进行图像检索,该技术需要人工手动标注文本关键词,以描述图像特征。它需要依赖人工对图像进行标注,需要较多的人力,且伴有主观性等方面的问题。尤其在人脸图像检索时,基于文本关键词文本图像检索技术显得很无能为力。上世纪九十年代以来,一种基于内容的图像检索(CBIR)开始变得流行。然而在近些年,由于一些信息系统所产生的图像速度飞速增长,基于视觉内容上的图像检索也开始成为一个重要的研究领域。由于自然光照,低分辨率和多姿态等构成了人脸特征提取的主要影响因素,目前基于自然光照场景,低分辨率和多姿态等多种自然混合条件下的研究仍是一个颇具挑战性的问题。本文采用多局部人脸特征融合方法,对人脸图像进行特征提取并得到人脸图像特征表示,然后借用聚类工具对人脸图像特征表示聚类,并对所有聚类进行性能评价,最后针对聚类的性能,选择不同聚类检索的方案,从而设计了一个具有准确和快速的人脸检索算法。本文主要贡献如下:1.收集一个完备的自然场景人脸检索数据集。人脸图像数据集为验证人脸检索算法好坏提供了充分条件,一个完整的数据集将会更全面地测试算法性能。在众多人脸图像检索实验中,FERET、BioID、LFW和ORL等图像集较为常用。但是,这些数据集中大多都是在正面人脸和特定光照下,在实际应用中不具有扩展性。在本论文中收集并整理一个更自然的数据集。其中学院监控视频录制了教职工、学生等人员在监控下的走动情况。该视频中,监控处于自然光照。学院监控视频的处理:对监控视频中变化的每一帧进行皮肤检测,椭圆检测,提取人脸,并处理和存储。具体来说,当下帧中得到的前景图像与背景帧图像之间是否有变化,一般认为有变化的时候就会有人的出现,如果变化程度达到某个阈值,认为这一帧中有人物出现,论文中利用当前图像帧减去背景图像,得到了变化的部分,并对这部分进行皮肤检测,椭圆检测,和使用Viola&Jones人脸检测算法人脸检测,然后使用最小矩形描述得到的不规则轮廓,同时,对每个不规则轮廓对应的最小矩形进行保存。这样做就最大可能地排除了自然环境下的非人脸区域。该数据集的整理均在Ubuntu系统下完成,约耗费30天,数据集中包含近一百个人,共计3167张图像,其中每一个人平均三十张图像。该数据集整理为验证论文中所述研究的可行性提供了良好的依据,也为以后的人脸检索研究贡献出一个数据集。2.采用光照补偿进行图像预处理。在数据集收集整理的过程已经使用过光照补偿。然而在人脸图像特征提取之前也使用了光照补偿预处理。在处理中首先对像素值进行按降序排序,并取降序排序后的图像像素中前百分之五像素值的平均值作为补偿因子,在此基础上对每一个像素值进行补偿,从而达到削弱光照影响的目的。3.局部特征提取并融合。考虑到仅凭借单纯一种人脸特征的人脸检索在检索效果上的不足,在本文中主要提出使用了HOG和LBP两种算法分别进行人脸图像特征提取并得到人脸表示,最后按照1:1的权重比例进行融合得到对应图像的基于HOG和LBP特征的自然场景人脸特征描述。4.聚类、聚类性能评价以及人脸检索。由于姿态和尺寸等影响导致类内对象较为疏远,造成人脸检索的漏检率较高。本文在局部特征提取和融合的基础上进行了人脸特征描述的聚类,保证同类对象间距离尽可能紧凑,类间距离疏远,与此同时,在检索过程中也就保证了检索的召回率,降低漏检率。在聚类中,本文选择完全相信聚类和半信聚类法进行聚类。最终针对非聚类,完全相信聚类和半信聚类进行比较,结果表明半信聚类优于非聚类和全信聚类,聚类优于非聚类。通过使用聚类提高了相似人脸的召回率和人脸检索的稳定性,与此同时,也保证了相似人脸检索的准确率。本文通过使用光照补偿的图像预处理,局部特征提取并融合以及人脸特征向量表示的聚类,在一个自然场景下的监控视频下所获取的数据集中进行人脸图像检索。首先光照补偿削弱了光照不足所造成的影响,特征的融合使得特征更加紧凑准确,特征向量表示的聚类在保证检索稳定性的同时,还提高了人脸检索的召回率和准确率。上述研究成果,在上班人脸签到,嫌犯追踪定位等诸多实际应用中,具有一定的研究意义和应用价值。
其他文献
随着社会的发展,人民生活水平的提高,精神文化层面的追求也在与日俱增,催生了各类艺术培训机构的蓬勃发展,舞蹈培训作为艺术培训的一个重要分支,也是顺势而发,增速喜人。同时,由于行业进入壁垒较低,也使得同质化竞争严重。所以如何赢得更多顾客,以获取竞争优势,就需要机构能够做好精确定位,推行有效的营销策略,这也是本文的意义所在。本文以HY舞蹈工作室为例,结合工作室的具体情况,介绍了工作室的背景,接下来对工作
表达能力的培养是高中语文教学的重要组成部分。“基于语文核心素养下的表达能力培养研究”旨在提升高中生的语言表达能力,凝练高中生的语文核心素养。近年来教育不断改革,高
研究目的:了解我国手足口病中柯萨奇病毒A16流行株的全基因组序列基因特征,为其疫苗的研制和手足口病防治提供科学依据。研究方法:从NCBIGenBank数据中下载我国各地区引起手足口病(HFMD)的柯萨奇病毒A组16型(CVA16)流行株和A组肠道病毒原始株的全基因组序列,利用生物信息学软件进行基因特征分析。采用MEGA 6.0软件,分析CVA16病毒流行株P1编码的结构蛋白上重要位点氨基酸的变异情
俄罗斯新西伯利亚州高尔基儿童图书馆在补充儿童教育、提高儿童素质及促进儿童健康发展等方面起到了显著的作用。我国应借鉴其成功经验,在以下几方面做出努力:加强儿童图书馆
人rén教jiào版bǎn二èr年nián级jí上shànɡ册cè《黄huánɡ山shān奇qí石shí》一yì文wén写xiě了le黄huánɡ山shān上shɑnɡ形xínɡ态tài各ɡè异yì的de石shí头tou。在zài中zhōnɡ国ɡuó有yǒu五wǔ大dà名mínɡ山shān,简jiǎn称chēnɡ五wǔ岳yuè,你nǐ知zhī道dào它tā们men分fēn别bié是shì什shén
新研究范式下,为了满足研究机构数据获取、保存和管理需求,美国康奈尔大学组建了自上而下的科研数据管理服务机构,基于科研数据生命周期提供更具深度和广度的科研数据管理服
不稳定型心绞痛的病理基础是冠状动脉粥样硬化斑块的破裂或糜烂并发血栓形成、血管收缩、微血管栓塞,导致急性或亚急性心肌供氧的减少。治疗策略主要在以下几个方面:①抗缺血
全面预算管理一直以来都被认为是管理体系中的发动机,然而随着市场经济的飞快发展,信息时代带来的高速变化,企业的知识观念、技能产品均发生了迅速地更新和变化,企业的经营目标也逐渐从利润最大化转向被各大学者所推崇的企业价值最大化,传统的全面预算管理已不再适用信息经济时代下企业的发展。本文将价值链理论引入企业的全面预算管理中,用链式结构来刻画企业的横向价值链、纵向价值链、内部价值链,使企业在价值链中所处位置