论文部分内容阅读
随着大数据时代的推进以及计算机硬件的高速发展,人工智能的应用与我们生活联系得越来越紧密。在人工智能中,深度学习成为了这一领域的研究热点,并在研究成果上取得了突破性的进展。其中在应用上深度学习涉及到了智能驾驶、智能医疗、图像处理、语音处理等领域。在深度学习算法中,卷积神经网络的使用最为广泛,尤其在图像处理中有明显的优势,在性能上有突出的表现,成为目前图像处理中的主流算法之一。与传统图像处理的方法相比较,卷积神经网络将一张二维图像作为网络的输入,通过网络逐层传播与计算,将图片中的显著特征提取出来,最终通过分类器实现图像的识别过程。这个过程不仅能有效的降低传统方法在图像预处理时的困难程度,还能降低人工在选择有效特征时的主观判断,能实现端对端的识别图像模式。本文研究主要是,结合近几年公开发布的经典卷积神经网络结构,重新设计新的网络结构,并提出一种新的网络整合方法。旨在避免经典网络单一性同时,能实现其它多种网络结构的优点,最终得到识别效果的提升以及节省资源的利用。本文的主要研究内容以及创新点如下:(1)介绍了卷积神经网络的主要内容,其中包含单个神经元、多层感知器的工作原理,另外介绍了网络的反向传播与网络的整体结构等,并以经典的网络为例,介绍卷积神经网络的运算流程;简单的描述了一下在本文使用的深度学习框架Caffe;对数据预处理如尺度归一化、去均值与数据增强做了介绍。(2)针对目前已发表的经典网络中结构单一问题,设计了一种多样化结构卷积神经网络应用在图像识别上。多样化结构网络是采用两条支路进行特征提取,一条支路为传统的CNN,另一条支路为带有残差操作的传统CNN。在下一次特征图降维前,通过级联操作将两条不同的网络支路结合在一起。多样化结构网络的设计在Food-101和Caltech256数据集中进行性能测试,将级联后的网络与两条支路网络进行对比,实验结果表明级联后的网络结构比两条支路中任一网络的精确度都高。(3)结合GoogLenet网络中Inception模块结构的思想,将多样化结构网络进行改进,设计出双支路网络模块结构。首先详细分析了Inception模块的整体结构,借鉴Inception结构的思想,改进自己的多样化结构网络。该模型结构在结合多样化结构网络优点的同时能大量的减少了资源的利用。模型将网络结构分为两条支路,分别采用卷积核为两个3×3以及一个卷积核为5×5的卷积层。最后将网络模型在公开数据集Food-101以及GTSRB数据集上进行性能测试,实验结果表明了该设计起到了良好的效果。(4)为了进一步的提高网络的多样性,以及针对整体网络参数较多的问题。本文首先引用一种超轻量网络结构模块,通过超轻量网络模块的减参作用,融入双支路网络模块结构,使整体网络增加了模块多样性。最后在Food-101和GTSRB数据集上进行验证,网络不仅在参数上吸取了超轻量网络模块的优点,也继续继承了网络结构多样性的特性,使整体网络的准确率及参数都得到了优化。