论文部分内容阅读
近些年来,随着硬件资源的迭代更新,深度学习算法大放异彩。深度卷积神经网络是深度学习中非常重要的网络结构,其通过权值共享、局部连接和降采样等操作简化了网络模型,提高了训练效率。图像分类是计算机视觉领域重要的研究方向,是指通过获取图像的显著特征以实现不同类别划分的图像处理技术。卷积神经网络实现了对图像像素的卷积,直接从图像像素中提取图像特征,这种处理方式比传统特征提取方式更为接近人类大脑视觉系统的处理方式,并且识别效果更好。不仅限于图像分类,卷积神经网络在人脸识别、目标检测、语音识别、智能监控等其他多个方向也取得了很好的进展,具有重要的研究意义和价值。本文基于卷积神经网络的图像分类算法展开研究。介绍了经典的深度学习网络AlexNet,在其基础上从多个角度设计新的网络并展开实验。从卷积层的扩展到并行卷积神经网络,再到并行尺度裁切卷积神经网络,在数据库Caltech-101和Caltech-256上进行实验,通过逐步对比分析改进前后网络在两个数据库上的分类准确率变化情况,确定了一种性能较好的并行网络。另外,在拓展后的网络上引入批归一化以及特征融合算法,实验准确率得到了有效的提高。本文的主要研究工作及创新点包括:(1)针对并行卷积神经网络(PCNN)的参数过多,模型训练时间成本高的问题,将全卷积神经网络中的随机裁切层引入到PCNN网络中,设计了并行尺度裁切卷积神经网络(PSC-CNN)。相较原并行网络具有更多的随机特征输入,并且降低了网络的运算负担。实验结果表明改进之后的网络在提升了分类准确度的同时缩短了模型训练时间。(2)引入批归一化以及特征融合方法设计了结合批归一化的双通道特征融合卷积神经网络。首先,设计一个DCNN,然后引入批归一化(BN)层,构建卷积单元块(Conv-Unit),结合多层特征融合的思想,构建了多层特征融合卷积神经网络MFFDCNN。在此基础上,提出双通道多尺度特征融合(DCFF)的思想,设计了一个DCFF-DCNN。最后分析了Batch size值的不同对网络模型识别准确率的影响。