论文部分内容阅读
鸟类物种多样性调查是了解鸟类群落结构和作用的重要内容之一。鸟类鸣声属于鸟类重要的生物学特征之一,具有较高的辨识度,在鸟类物种分类和行为学研究中得到广泛应用。近几年,新提出的利用自动录音设备和识别软件,通过鸣声识别实现鸟类调查的方法因高效率、非损伤、低干扰、大范围的监测优势具有巨大的应用前景。本文面向鸟类统计分析的需求,针对自然环境下基于鸣声的鸟类物种识别存在随机干扰噪声降低识别效果、手动提取鸟鸣声差异特征困难以及识别模型识别效率低等问题,在鸟类鸣声的处理、物种识别及应用三方面展开研究,本文主要工作如下:1.提出一种基于迁移学习的鸟类物种识别方法。鉴于深度学习技术对数据量要求较高且鸟类数据来源有限,提出一种基于特征和模型迁移学习的物种分类方法,对自然环境中音频信号的进行预处理,利用时频分析法得到去噪后音频信号的语图,经数据增强技术扩充后建立语图图像样本库;通过卷积神经网络(Convolution Neural Network,CNN)自动提取语图高层次特征并完成分类,为其它鸟类项目的应用提供了研究基础。2.提出了基于双模态特征融合的鸟类物种分类算法。本文结合卷积神经网络和长短时记忆网络(Long Short-Term Memory,LSTM)的结构,建立一种更具有泛化能力的卷积-长短时记忆神经网络(Convolution Long Short-Term Memory,CLSTM)网络模型,优化网络结构包括输入的预处理,学习速率,防止过拟合,梯度消失等问题,融合卷积网络提取的语图特征和长短时记忆结构提取的鸣声时序序列特征,自适应完成基于鸣叫或者鸣唱的物种识别。实现了鸣声分类算法的优化,提高了识别效果。3.设计了基于MVC(Model View Controller)架构的移动端嵌入式鸟类识别系统。本文利用Eclipse开发工具开发了一套面向实际采集鸣声信号的鸟类识别软件,客户端APP集合了数据模块、View图像模块、控制模块等功能。本文开发的人机交互界面具有较高的识别性能,完善了基于安卓的鸟类个体的自动识别任务,推动鸟类资源调查和监测的自动化。为了验证本文提出的算法的有效性,利用鸟类公开数据集Xeno-canto和北京市松山国家级自然保护区采集的18种鸟类音频分别进行算法和应用实验验证,并与传统的算法及模型进行对比,实验结果表明,本文方法在识别准确率、精确率、召回率、F1值等性能评价指标上均有较大提升。实现了基于鸣声的鸟类物种自动分类与统计,该成果也可以推广到其他鸟类数量的自动统计中,具有重要的理论意义和工程应用价值。