论文部分内容阅读
随着科学技术不断进步以及互联网技术的不断发展,每天产生的图片数量呈几何式增长。图像分类作为图像识别、图像分割等计算机视觉任务的基础,得到了更为广泛的研究。传统的图像分类方法重点在于特征提取和分类器的选择,该方法提取到的特征大多数是人为设计的,在效果上会有所偏差。近年来,深度学习在图像分类领域取得了很好的成绩,成为图像分类的主要研究内容。但是,基于深度学习的图像分类方法存在内存密集以及计算密集的缺点,无法更好地应用于低内存的移动设备中,需对网络模型进行压缩与加速。本文提出了基于MobileNets轻量级网络的改进的模型结构,通过对轻量级网络MobileNets进行改进,来减少参数或提高分类准确率。1.提出了一种基于局部感受野扩张的D-MobileNet模型的图像分类方法。因为空洞卷积核可在不增加参数的前提下扩大局部感受野,因此我们用空洞卷积核替代MobileNets模型某一层的卷积核,扩大该层的局部感受野,提取到更大范围的特征。该方法可以在不增加模型的参数数量的前提下提高分类准确率。实验分别在Caltech-101、Caltech-256以及图宾根大学动物分类数据集上进行,结果表明D-MobileNet模型最多可获得比MobileNets高2%左右的分类准确率。2.提出了一种基于密集连接的B-MobileNet模型的图像分类方法。在MobileNets模型中引入密集块,并通过密集连接可多次利用密集块内前面卷积层输出的特征图,通过设置适当的超参数增长率减少网络模型中参数量和计算量。本文将引入了密集块的B-MobileNet分别在Caltech-101和图宾根大学动物分类数据集上进行对比实验,结果表明,改进后的B-MobileNet模型在参数上可减少为原网络模型的1/2-1/3,速度可提高2倍左右,同时精度最多减少1%。其中B2-MobileNet模型在两个数据集上的分类精度还有所增加。