基于深度学习技术的大规模人脸检索研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:hackrx123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今社会,高速发展的互联网技术影响着人类生活的各个方面。在这个信息交互频繁的时代,互联网中积累了大量的图像数据。如何有效的组织和利用这些各式各样的图像数据,成为了一个目前亟待解决的问题。这也催生了基于内容的图像识别与检索技术的兴起和发展。随着图像数量的增加,图像检索精度与检索速度面临着巨大的挑战。哈希方法以其高效性与低内存占用在图像检索技术中配受青睐。同时,得益于深度学习技术在计算机视觉领域中的飞速发展,深度哈希技术逐渐成为图像检索领域中的主流方法。在已知的端到端的深度哈希技术中,人们只关注图像之间的相似性,而忽略了图像本身的语义信息,使检索模型的性能受到限制。而且在大规模数据训练中忽略了标签空间对训练过程带来的影响,使得模型在训练的过程中难以收敛。本文针对以上问题,对目前主流的深度哈希方法进行了改进,提出了一种结合图片本身语义信息与图片相似性的深度哈希方法,提升检索模型的性能,并且使用异步训练方法与优化数据生成解决了大规模数据与大标签空间数据在训练过程当中出现的网络不收敛,训练不稳定等问题,提高了检索的精度。本文进一步设计并实现了一种基于GPU的多进程多层次的并行检索方案,加快了大规模数据集上的检索速度。本文的具体工作如下。1)提出了一种多任务深度哈希方法,在现有的深度哈希方法上,采用了分类任务和哈希编码任务结合的深度学习方法,将分类损失和哈希损失结合,尽可能得利用图片的语义信息对哈希编码任务进行指导学习。最终得到一个端到端的特征提取与哈希编码多任务网络,使用MS5W数据集(中科视拓公司私有数据集,包含50000多个人脸标签340万人脸图像数据。)进行训练,在MSAS(该数据集为微软人脸数据集与格林深瞳公司公开的亚洲名人人脸数据集混合清洗得到的,具有90000多个人脸标签,510万人脸图像数据)数据集上进行了验证,证明该方法的有效性,使模型性能提升了2个MAP(Mean Average Precision)指标。2)设计并实现了性能更好的网络结构,以ResNet网络结构为基础,使用更合理的特征编码方式,使网络的训练过程更加稳定,收敛速度更快。使用该网络可以得到更高的检索精度。该网络在MSAS数据集上测试并提升了 1-2个MAP指标。3)使用用Triplet Loss代替Softmax Loss作为分类损失函数,解决了大标签空间数据训练困难的问题。设计并使用了一种高效的数据输入方式,使得该网络的训练更加稳定,使用异步训练以及线上生成三元组的方法,使得网络可以迅速收敛。4)基于汉明排序的基础上提出了一种基于GPU多层次多线程的并行批次检索策略,使得在损失一定2%-3%精度的条件下,检索速度可以提高50多倍。最终在百万级数据库中完成单张图片检索速度为1.8ms。
其他文献
信息素(pheromones)是生物个体之间信息交流的化学物质。警觉信息素(alarm pheromones,APs)是动物在面对压力或受伤时分泌和释放的一种信息素,可向同种其他个体传递危险信号,使其产生特殊生理行为的改变,如呆僵时间延长或移动距离缩短等,对生活在食物链下游动物,如啮齿类动物的存活及其种系维持具有重要意义。我们前期的研究结果表明APs及其主要成分2-sec-buty-4,5-dih
目的:以肺癌A549细胞作为研究对象,探讨半枝莲提取物对肺癌A549细胞增殖、凋亡的影响及与内质网应激之间的关系。方法:采用体外培养的肺癌A549细胞进行实验。1、观察不同浓度
罂粟科(Papaveraceae)博落回属植物(Macleaya R.Br)包括博落回Macleaya cordata(Willd).R.Br和小果博落回Macleaya microcarpa(Maxim.)Fedde。目前已从博落回属植物中发现100余个生物
目前,手性化合物的研究越来越受到关注,其中手性配合物及手性金属-有机框架物具有多变的结构、富含孔道、特殊的配位键环境等优点,在手性拆分、不对称催化、气体吸附分离、化
TLR4作为模式识别受体家族成员,是天然免疫反应中的重要部分,通过识别革兰氏阴性菌细胞壁主要成分脂多糖(LPS),激活下游炎症因子的表达,促使炎症的发生以对抗细菌的入侵。大肠
植保机械可以减轻劳动者的工作负担,在世界范围内广泛应用于大型农作物管理作业中。植保机受复杂田间路面环境、药液晃动以及自身不确定的机械运动状态等因素的影响,在作业过
全球气候变化引起的高温已成为威胁全球作物生产与品质的一大逆境。明确高温对作物产量和品质形成的影响及其原因,对培育作物耐高温新品种、制订抗高温栽培技术措施具有重要
本研究以800名大学生为被试,考察了羞怯对网络成瘾的影响以及作用机制。本研究基于网络成瘾的非适应性认知—行为模型(PIU)建立理论模型,并通过结构方程模型及模型间比较的方
含氟有机物具有显著增强的生理、药理活性,在医药和农药领域应用广泛。目前,在上市的药物中含氟药物占有较大的比重,尤其是含三氟甲基的药物是典型的代表。因此,将三氟甲基引
目的:观察PD-L1分子在临床肝内胆管癌(intrahepatic cholangiocarcinoma ICC)患者组织中的表达;观察并分析PD-L1、IFN-γ、TNF-α、VEGF在ICC小鼠原位模型中的表达;观察PD-L1