论文部分内容阅读
随着深度学习的发展,细粒度物体分类逐渐成为了研究热点。与通用图像分类任务不同,细粒度物体分类的目的是区分子类别,例如狗的不同品种。细粒度物体分类中不同子类的物体之间可能只有细微的差别,甚至连人类也难以识别;而属于同一子类的物体受到复杂背景、遮挡、尺度和视点变化的影响在图像中的外观差别可能很大。现有的许多方法依赖于对物体和有区分度部分的人工定义和标注,有主观性强、不易扩展的缺点。针对细粒度物体分类问题的特点和现有方法的不足,本文设计和实现了一种结合注意力机制的细粒度物体分类方法。该方法首先用以卷积神经网络为基础的模型对图像中的待分类物体进行分割,然后根据前景掩码求得包围盒并裁剪图像,用综合了卷积神经网络、循环神经网络和注意力机制的分类模型进行分类。本文通过在三个数据集上的实验验证了方法的有效性。