【摘 要】
:
人脸识别是计算机视觉和人工智能领域最重要的研究方向之一。随着大数据时代的逐步到来,各大媒体数据有了井喷式的增加,人脸识别的需求也在随之增加。传统的人脸识别技术只能解决小规模人脸识别问题,在面对大量人脸图片时的实时性非常低,而且在单机环境下训练效率低下、人脸数据存储困难。因此,如何能够快速、准确的从大量的人脸图像中识别出一个人的信息成为当前人脸识别技术的主要研究方向。为解决以上问题,本文进行以下研究
论文部分内容阅读
人脸识别是计算机视觉和人工智能领域最重要的研究方向之一。随着大数据时代的逐步到来,各大媒体数据有了井喷式的增加,人脸识别的需求也在随之增加。传统的人脸识别技术只能解决小规模人脸识别问题,在面对大量人脸图片时的实时性非常低,而且在单机环境下训练效率低下、人脸数据存储困难。因此,如何能够快速、准确的从大量的人脸图像中识别出一个人的信息成为当前人脸识别技术的主要研究方向。为解决以上问题,本文进行以下研究:(1)首先进行理论研究。详细分析了Hadoop大数据处理架构的关键技术:HDFS读写数据的流程、MapReduce的原理和HBase的软件架构。为解决单机环境下非结构化人脸数据存储困难的问题,提出了利用HDFS和HBase存储数据的解决办法,充分利用HBase列式存储的优势来提高存储能力。(2)针对传统的基于CNN的人脸检测算法在人脸检测实验中准确率较低的问题,提出一种改进的MTCNN人脸检测算法。对原MTCNN算法进行模型迁移来缩短训练时间,通过实验比对不断调整MTCNN网络模型的主要参数,精简重复检测的人脸候选框,根据候选框人脸准确度分数,提出人脸误检测判别公式,提高人脸检测准确率。实验表明,与传统的算法相比,改进后的MTCNN算法在教室环境下的人脸检测准确率提高了3.8%。(3)对于Hadoop在处理海量小文件时表现不佳的问题,本文采用对小文件无损压缩和合并小文件的方式。通过压缩文件,减小Name Node的压力,使用Sequence File方法将小文件合并成大文件,减少小文件数量过多给HDFS造成的存储压力。经实验验证,读取并输出同样数量的文件,经小文件合并后的任务运行花费时间更短。(4)为解决传统人脸识别方法实时性差的问题,本文使用将PCA人脸识别算法与Hadoop批处理MapReduce相结合的方法。对PCA人脸识别算法使用Map计算欧式距离,得出处理结果,用Reduce对结果进行汇总,得到最小欧式距离对应的内置图片信息作为最终人脸识别的结果并上传到HBase数据库存储。实验表明,在大量人脸图片情况下,MapReduce并行计算模式相比单机环境下人脸识别速度更快。(5)为进一步验证Hadoop集群环境下人脸识别的优势,本文进行了三个对比实验,分别为集群模式与单机模式下的人脸识别时间对比,不同的集群节点数量对计算性能的影响,以及集群模式下MapReduce配置不同的并发数对计算效率的影响。通过对比实验对整个课题的研究进行性能上的测试,取得了良好的测试结果。
其他文献
X射线(X-ray)是一种波长极短、穿透力强的电磁波,在医学诊断、放射治疗、空间探测、安防、环境监测、工业检测以及基础科学研究等领域有着广泛的应用。这些日益增长的应用需求对X射线探测器的灵敏度、响应和恢复速度、剂量检测限、能量和空间分辨率以及稳定性都提出了新的要求。本世纪初,新型X射线探测技术开始受到研究人员重视;尤其在近五年,相关研究取得了快速发展,新材料、新结构不断见诸报道,性能指标不断刷新纪
芽殖酵母(Saccharomyces cerevisiae)以不对称分裂的方式繁殖,纺锤体定位是保证命运决定因子通过细胞分裂精确分配到子细胞中的关键一环。已知Kar9与Dynein两条通路共同控制有丝分裂纺锤体的定位。Num1是一个在Dynein通路中发挥重要作用的膜蛋白,它为从胞质微管正端卸载到细胞膜上的动力蛋白Dynein提供细胞膜上的锚着点,便于其通过微管产生拉力定位纺锤体。已有不少研究报道
车联网能够全方位提高车辆互联和智能交通运输服务,如道路安全、交通效率和互联网接入等。但是由于车载通信网络的高速动态性,并且无线信道特性会因为道路附近的行人、建筑物、障碍物、以及道路上的车辆等因素构成的复杂交通环境的变化而改变,从而导致无线频谱和功率等资源管理受到较大影响,通信性能也受到很多挑战。因此如何有效的设计车辆到一切(V2X,Vehicle to Everything)通信资源管理至关重要。
多光谱激光雷达可以同时获取被测目标的空间信息和光谱信息,形成多光谱激光雷达点云。这种点云和现有的单色的激光点云相比具有更好的可视化效果、更高的地物识别能力。然而,由于受到扫描设备、探测环境和操作人员的影响,点云中会存在噪声点。为了得到可视化效果更好,精度更高的多光谱激光雷达点云,必须对点云中的噪声进行去除。本文主要以多光谱激光雷达获取的点云为研究对象,开展了去噪研究,主要内容如下:(1)根据多光谱
哮喘是一种以慢性气道炎症和气道高反应性为特征的异质性疾病。患者常出现呼吸困难、发作性胸闷和咳嗽,伴有哮鸣音等症状。全球哮喘的发病率仍呈上升趋势。哮喘给人类健康带来了巨大威胁,是急需解决的医学难题。抑郁症是哮喘常见的共发症之一,研究表明两种疾病之间有一些相同的发病机制,因此,我们猜想治疗抑郁症的药物是否也有改善哮喘的作用。通过前期的筛选以及预实验,我们发现盐酸氯米帕明(Clomipramine HC
自药剂学进入给药系统(DDS)时代,研究者们已经开发出了不同的智能给药系统。与传统药剂学相比,这些智能给药系统在增强治疗效果、降低毒副作用等方面具有很大的优势;同时智能给药系统可以满足个性化医疗的按需给药和按时给药的要求。在智能给药系统研究的过程中,以下两个问题值得思考:(a)靠血液循环的给药系统在毛细血管末端组织或生理屏障部位存在富集或释放慢的问题。或许能构建自振荡给药系统来解决问题。(b)很少
电离层是高层大气在太阳辐射以及各类宇宙射线的影响下发生电离而出现的大气层电离区域。电离层是地球大气的重要组成部分,它对无线电波的传播起着至关重要的作用,能够使无线电波折射、反射、散射等。因此,研究电离层的结构和相关变化特性显得尤为重要。本文基于全球卫星导航观测组织(International GNSS Service,IGS)提供的地基GPS卫星观测数据,对美洲地区(300°E经度附近)不同半球的
随着社会电能应用水平的提高,家庭用电设备种类逐渐增多,居民的用电量剧增,电气火灾事故频发,以至于低压线路中的用电安全和能耗分析倍受关注。故障电弧是引发低压线路下电气火灾的重要原因之一,由于目前我国对串联故障电弧的检测设备并不完善,电气火灾监控系统对居民用电的分析功能欠缺,因此本文将电气火灾监控系统和智能电网中的非侵入式负荷辨识技术相结合,基于低压线路中串联故障电弧的特性和不同家用负荷信息的差异性,
荜茇为胡椒科植物荜茇(Piper longum L.)的干燥近成熟或成熟果穗,又名荜拔、荜拔梨、鼠尾等。荜茇味辛,性热,归胃、大肠经,具有温中散寒,下气止痛之功效,常用来治疗脘腹冷痛,呕吐,胸痹心痛,头痛,牙痛,消化道和生殖系统的炎症等。本论文研究荜茇中的化学成分及其生物活性,为荜茇的进一步研究和开发应用提供科学依据。本论文采用溶剂提取法,正、反相硅胶柱色谱法,葡聚糖凝胶LH-20,半制备高效液相
滇重楼是传统药用植物,野生资源匮乏。人工种植是解决滇重楼药源紧缺的有效途径,但许多人工种植品存在品质下降的问题。利用内生菌保障和改良中药植物品质是当前研究的热点之一。本研究以人工种植的5年生滇重楼为对象,采用Illumina Miseq测序技术和微生物培养技术分别分析根茎、茎和叶3种组织总内生真菌及可培养内生真菌的多样性及菌群特征,以及分析与重楼皂苷含量相关的内生真菌(属);通过与小麦幼苗共培养筛