【摘 要】
:
近年来,随着地球生态环境的恶化,鸟类生物的生存受到更多威胁。为了保护鸟类、保护地球物种多样性,构建自动的鸟类图像识别系统成为当务之急。基于计算机视觉的鸟类图像识别属于细粒度图像识别任务,致力于对大类之下的子类进行区分。在所有细粒度图像识别任务中,鸟类图像识别以其较大的类内差异和较小的类间差异,成为最经典、最复杂的细粒度识别任务之一。其难点在于:图像背景复杂,不同类别之间的差异往往体现在某些细微之处
论文部分内容阅读
近年来,随着地球生态环境的恶化,鸟类生物的生存受到更多威胁。为了保护鸟类、保护地球物种多样性,构建自动的鸟类图像识别系统成为当务之急。基于计算机视觉的鸟类图像识别属于细粒度图像识别任务,致力于对大类之下的子类进行区分。在所有细粒度图像识别任务中,鸟类图像识别以其较大的类内差异和较小的类间差异,成为最经典、最复杂的细粒度识别任务之一。其难点在于:图像背景复杂,不同类别之间的差异往往体现在某些细微之处;鸟类姿态多变,简单特征难以表达图像信息;数据量小,训练中存在过拟合风险。对此,本文从事基于深度学习的鸟类图像识别研究,采用基于部位的思想将识别任务划分为四个模块:目标与部位检测、数据扩增、特征提取和分类决策,分别解决上述问题。本文在目标与部位检测模块中运用强监督目标检测模型单次多目标框检测器实现鸟类目标和关键部位的检测定位,通过目标定位获取鸟类目标前景,剔除背景干扰,通过部位定位获取对分类起重要作用的局部区域,以期实现特征的精确提取,且该模块的处理给识别系统赋予了多分支结构,后续模块需要对各分支分别进行处理;在数据扩增模块中引入生成式对抗网络的思想,基于深度卷积生成式对抗网络进行鸟类图像数据的生成,以扩增数据量,降低复杂模型的过拟合风险;在特征提取模块中使用基于高斯分布建模的图像二阶信息实现图像特征提取,将鲁棒近似无穷维高斯描述子和具有端到端训练特性的矩阵幂归一化协方差引入识别系统,以获取具有更强的表征能力的图像高阶信息;在分类决策模块中引入集成学习的思想,通过选用合适的分类算法,分别采用平均法和Stacking算法实现多分支子系统的决策级别分类融合。为了验证算法的性能,本文在标准鸟类图像数据库CUB200-2011上进行大量实验,分别对不同模块进行考察,分析其有效性和可行性,并对整体识别系统的算法性能进行评估。在测试阶段不使用任何标注的前提下,本文提出的算法可以在CUB200-2011数据库的验证集上取得89.7%的识别准确率。在现有公开发表的文献中,该性能指标处于当前先进行列,排在并列第一位。
其他文献
歌唱中呼吸很重要,正确的歌唱呼吸,是获得美好音色的基础,也是衡量歌唱方法的重要标准之一。书中理论解说得非常清楚,歌唱者却难以理解透彻。演唱者只有充分的了解歌唱的呼吸
江西省地貌独特,造就了多彩的地域文化,为江西特色动漫的创作和发展提供了丰富的故事题材和创作背景.本文将以江西风情各异的地域文化及其特点为出发点,结合江西文化中可挖掘
目的 了解单用噻托溴铵与噻托溴铵联合吸入糖皮质激素治疗哮喘-慢阻肺重叠综合征的作用。方法根据哮喘-慢阻肺重叠综合征(ACOS)诊断标准选取2014年6月—2016年6月该院收治的110
随着中国经济的迅猛发展,综合国力和文化软实力的显著提高,来中国学习汉语的留学生日益增多。最近几年,中国和印度的关系比较微妙。巩固发展两国关系,促进民间交流非常重要。现如今,越来越多的印度留学生来到中国学习汉语或者学习医学或其他专业。对于来华学习汉语的印度留学生,汉语语音教与学的方法有待提高。初学汉语的印度留学生在汉语学习中会遇到各种各样问题。在语音学习方面,发音部位和发音方法容易受其母语和第二语言
以SiCl4和H2为气源,用等离子体增强化学气相沉积技术,在300℃的低温下,研究不同的氢流量对纳米晶硅薄膜生长特性的影响。实验发现,氢对薄膜生长特性的影响有异于SiH4/H2,在一定功率
阐述不确定性分析在化工投资项目可行性研究中的重要的性;介绍盈亏平衡分析、敏感性分析、概率分析3种最常用的不确定性分析方法.
橡胶的干燥特性是干燥设备设计的关键.本文结合实际的干燥系统,建立了橡胶干燥的数学模型,编制了橡胶干燥过程的动态模拟程序,对干燥过程进行了动态模拟,并分析了影响橡胶干
对于虚拟财产这种新兴的财产类型,我国目前在理论上存在较大争议,立法上存在相应空白,实践中又面临着诸多难题。文章着重分析了网络游戏中虚拟财产纠纷的特点,比较、借鉴国外
时代的发展对高等职业教育提出了更高的要求,要求我们培养的学生不仅要有扎实的理论基础,更要有较强的实践操作能力.由于我们的高职教育的发展尚不发达,教学理念、教学设备、
在高中语文课堂教学中,教师根据教学实际适时引入合作互动学习方式,能够有效激活课堂教学气氛,提升课堂教学效度。教师采用多种教学手段创设课堂互动情境,在互动中注入情感,