论文部分内容阅读
图像特征提取是指从图像中提取出有利于图像视觉任务的特征表达,其表达能力直接影响图像视觉任务的性能。近年来,深度学习极大地提升特征表达的泛化能力,性能表现优于传统学习方法,已成功应用于图像分类、目标检测等视觉任务,甚至在某些领域超过了人类表现。目前,深度学习模型的研究内容包括网络架构和损失函数两大主要方向。前者探索深度卷积网络中卷积的通道数、卷积层数、不同卷积核的组合以及不同分支的自适应选择等,通常以网络基本块为粒度构建网络,而后者是度量深度卷积网络的预测值和和真实值间距离,用于指导深度网络的训练。这两方面内容均对深度卷积网络的性能影响较大。事实上,它们皆是研究者们对不同深层特征语义信息的初步改造,具有重要的理论贡献和广阔的应用前景。当前面向图像分类的网络架构和损失函数的研究点分别是关注机制和交叉熵损失函数。为此,本文主要工作为:1)设计新型的关注机制基本块。关注机制是受人类视觉系统的注意力现象启发,其目的是关注感兴趣的特征区域。当前常用的关注机制主要是用于端到端训练深度网络的软关注,可分为通道关注和空间关注两类,分别对应着给通道加权和特征图元素进行加权操作。本文提出的新型关注机制,通过无参数激励函数和简单卷积操作,利用自身深度特征为特征图中的每个像素生成相应的关注值。该机制可无缝嵌入到当前深度卷积网络中,提升了现有两类主流深度网络的图像分类性能。2)提出新型中心损失函数,克服现有交叉熵损失函数的两类限制:仅考虑类间距离,对类内距离的语义约束模糊;泛化能力受限。具体为,新型中心损失函数通过中心化深度特征来减小同类特征间的距离,同时通过增加各类特征的中心至全局中心的距离来明确增加类间特征的距离;提出的损失函数通过使用中心化卷积神经网络的概率输出,提升网络的泛化能力。利用新型中心损失函数训练两类主流深度卷积网络用于图像分类,其分类性能优于现有的基准损失函数。