论文部分内容阅读
图像分类作为计算机视觉技术的基础,成为当前人工智能领域的研究热点之一。深度学习及卷积神经网络的发展,为图像分类的研究奠定了技术基础。但当前深度卷积神经网络存在梯度消失和过拟合问题,制约图像分类的发展。为解决上述问题,本文通过分析与研究深度多级残差(RoR)网络,提出其优化方案并实现准确的图像分类。首先,分析残差网络和多级残差网络特点,搭建深度多级残差网络,并在此基础上建立Pre-RoR和RoR-WRN网络缓解梯度消失问题,优化多级残差网络,采用随机深度算法有效控制网络过拟合问题,节省训练时间。其次,分析几种激活函数的性能,提出一种深度多级残差网络的优化方法。分别采用三种不同的激活函数(ReLU、ELU和PELU)设计多级残差网络结构,并通过分析其在不同数据集上的图像分类性能,获得不同数据集上的最优网络模型;其次,通过加宽网络避免网络过深,并引入随机深度算法抑制过拟合,进一步优化网络,以获得更好的分类准确性。再次,通过分析多级残差网络的性能特点并结合金字塔模型,提出一种金字塔多级残差网络的模型框架。分析不同残差块的结构对性能的影响,选择最利于分类性能的残差块结构,应用于金字塔RoR;最后通过调整网络的输出维度与深度避免网络过深并提高网络性能,引入随机深度算法抑制过拟合。为了验证方法的有效性,在CIFAR-10/100、SVHN和Adience数据集上进行图像分类实验。并在CIFAR-10/100、SVHN数据集上取得了目前最低的分类错误率,分别为2.96%,16.40%和1.59%。在Adience数据集上取得了61.87%的准确率,以及93.39%的1-off准确率。本文创新性地提出优化的深度多级残差网络实现准确的图像分类,在CIFAR-10/100、SVHN三种数据集上均获得了目前最好的图像分类结果。实验结果表明,本文所提方法能有效提高图像分类的准确度。