基于图像内容理解的图片自动管理方法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户：zmzsyx

【摘要】

：

随着数字媒体技术的不断发展,人们的多媒体信息也变得日益丰富。与此同时,一个显著的问题是,如何有效的管理这些多媒体资源。近年来,国内外对此已有一些初步的研究,但大都不

【作者】

：

杜佳慧

【机构】

：

北京交通大学

【出处】

：

北京交通大学

【发表日期】

：

2018年01期

【关键词】

：

场景分类图像检索近似搜索人脸验证人脸识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数字媒体技术的不断发展,人们的多媒体信息也变得日益丰富。与此同时,一个显著的问题是,如何有效的管理这些多媒体资源。近年来,国内外对此已有一些初步的研究,但大都不太系统,在实际应用过程中也有很多问题。针对于此,本文探讨了通过图像内容理解的方式对图片进行分类管理的方法。具体将从以下几部分展开:图像的场景分析、特定目标识别中特征学习的有效方法探究(以人脸识别到人脸验证的迁移为例)、特征搜索算法设计优化与实现等。对于面向图像自动管理的场景分析部分,本文首先分析了原始图像分类中单类别分类的目标局限性,在此基础上提出了一种适应于日常生活照片的多标签场景分类网络。其次,分类网络的基模型采用一个计算精简,移动端友好的Shufflenet网络作为基础结构,避免了常见网络分类需要在服务器部署,并由网络传输等带来的一系列包括但不限于数据隐私,网络延迟、模型过大的存储等问题。再次,作为对基础网络的一个优化,引入了注意力模型,通过深度卷积网络通道上的加权使分类模型对数据有更好的适应性。此外,对于损失函数,考虑到多标签分类网络中正负标签比例不均衡的情况,设计了一个均衡的二元交叉熵损失函数,以对数据更好的建模。最后,本文也实现了在iOS系统上的实时场景分类演示。在iOS系统上的实时演示结果表明,本方案是一个具有巨大应用价值的方法,值得推广。对于面向图像自动管理的特定目标(人脸)识别部分,本文创新性的提出了带约束的基于人脸识别模型的网络训练方法。其中约束项充分考虑了类内紧致,类间具有足够区分度的性质,以及减少了特征学习过程中的冗余性。与此同时,考虑到网络获取的图片类别标注噪声问题,引入了基于径向基函数的距离加权。实验证明虽然训练过程采用分类器模式,由于加入了约束项作为先验知识,特征也能很好的迁移到人脸验证任务上,并不需要显示的动用对验证进行独特优化的度量学习方法,并且具有收敛速度快的特点。同时由于这些约束项只在训练过程中引入,在实际测试过程中并不会引入运行时负担,具有很好的时间性能。对于面向图像自动管理的高效搜索部分,本文引入了两种近似搜索算法——基于分段矢量量化的近似搜索算法和基于倒排序表的近似搜索算法。这两种算法分别适用于内存有限的情况和对速度要求较高的情况,可以适用于不同的应用场景需求。同时,本文针对原始工程实现中不完善的地方进行了优化和完善,使得搜索效率进一步提高。

其他文献

冬小麦叶面积指数反演与病害光谱识别研究

随着全球变暖,病虫害的发生给冬小麦产量和品质带来了巨大损失。冬小麦生长过程中主要遭受病虫害(包括条锈病、白粉病、蚜虫等)和水肥胁迫等影响。如何及时监测和正确区分不

学位

叶面积指数条锈病白粉病蚜虫水肥胁迫叶片光谱冠层光谱优化光谱指数冬小麦

基于通用处理器的无线信号处理方法研究

摘要：无线移动通信系统中对于无线信号处理的实时性要求很高,传统的信号处理设备都是基于硬件平台的DSP或FPGA上实现的,但由于DSP平台系统开发的信号处理模块多数是非开放性的

学位

通用处理器信号处理PNLTE算法信道测量PDP

电动汽车电池管理系统SOC估计算法研究

电池荷电状态(SOC)的估算是电动汽车电池管理系统中的核心问题，也是技术难点之一。准确的估计SOC不仅对提高汽车整体性能和电池寿命效率具有重要意义，还有保证安全驾驶和降低运行成本的作用。本文针对磷酸铁锂电池SOC的估计算法进行了研究。通过对当前各种动力蓄电池SOC的估算方法进行比较和分析，选取卡尔曼滤波方法进行估算。对磷酸铁锂电池工作原理、结构及特点作了简单介绍。分析了电池的电压特性、内阻特性及循

学位

SOC估算磷酸铁锂电池电池模型Kalman滤波算法

基于OSPF的网络信息收集的设计与实现

随着互联网的迅速普及和爆炸性发展,其体系架构原始设计方案中的缺陷和弊端逐渐显露出来：现有互联网难以根据实时网络状态动态适配网络资源,导致网络传输效率低下、网络服务方

学位

智慧协同网络OSPF网络监控信息传递机制

高速铁路数字电视传输关键技术研究

摘要：随着我国高速铁路的快速发展,其运营里程已经成为世界第一。高速铁路让旅客的出行变得更加便利,可以预见在未来越来越多人将会选择高速铁路作为他们的出行方式。因此,高

学位

高速铁路数字电视多媒体广播多播业务单频网喷泉码

H.264编码关键模块并行算法设计及其在CUDA上的实现

视觉是人类获取信息的主要途径。视频作为视觉信息的载体,其数据量大,难于传输和存储,因此开发高效的视频编解码算法一直是学术界和工业界的关注点。从第一代视频编码标准H.2

学位

H.264CUDA并行算法运动估计码率控制

认在无线电系统中资源分配策略研究

近年来，随着无线通信业务的快速增长以及对无线通信信息传输速率和质量的要求越来越高，可用频谱资源变得日益紧张。因此如何有效充分地利用频谱资源成为无线通信技术发展的关键

学位

无线通信认知无线电系统资源分配多组多播系统传输功率

基于投影栅线法的柱状药表面粘接剂厚度检测方法研究

某柱状药外表面需粘贴一个包覆衬套,两者之间的粘接质量直接决定了该柱状药的发射性能，而刮涂的粘接剂的厚薄是影响药柱和包覆层粘接质量的主要因素之一。因此研究一种非接触

学位

投影栅线法柱状药厚度测量傅里叶变换轮廓术

基于非负矩阵分解的盲信号分离方法研究

盲信号分离（Blind Signal Separation, BSS）技术是指在源信号和传输通道参数均未知的情况下，仅利用信号间的少量先验知识，由观测到的混合信号恢复出源信号的过程。盲信号分离在无

学位

盲信号分离非负矩阵分解增量非负矩阵分解反馈机制

掺铥大模场光纤设计及其放大特性分析

2μm掺铥光纤激光器由于具有更宽的调谐光谱，因此在窄线宽高功率输出方面具有更大的优势，在塑料材料的激光焊接、切割等领域也有着重要的作用。由于受激布里源散射(Stimulated

学位

掺铥光纤放大器结构参数模场面积转换效率

基于图像内容理解的图片自动管理方法研究

其他学术论文