基于深度学习的作物虫害快速识别与分割算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:za123aaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是农业大国,在农业生产过程中病虫害的防治自古以来是一大难题。目前农业病虫害的分类及相应的数量统计主要由人工完成,这种方法存在劳动强度大,效率低等不足。传统的机器学习虽说可以实现一定程度上的智能化作业,但是太依赖与特征的选取,而特征的获取又依赖于具体的问题和专业的知识。深度学习的出现使得图像特征的提取完全交给神经网络,提取到的特征更加全面,更有利于目标识别与分割。虽然虫害的识别及分割都已经取得了一定的进展,但是仍面临诸多挑战,大致包括以下三个方面:一是目前的研究大多针对某种或者特定几种虫害进行识别及分割,训练出来的模型适用性差;二是虫害目标检测在实时性方面还有待进一步提高;三是虫害目标检测能获取的相关信息不够全面,基于深度学习的虫害分割研究需要进一步深入,且分割效率有待提高。基于以上问题,本文以4285张涉及5个昆虫目级阶元,危害作物种类多达数百种的37种作物常见虫害图像为研究对象,基于深度学习等相关技术对虫害目标检测及分割展开相关研究。本论文的主要研究工作包括以下几个方面:(1)针对传统人工识别和模式识别在虫害检测方面效率低、预处理复杂、识别准确率低等不足,本文基于单级目标检测模型YOLO(You only look once)对虫害检测展开相关研究。首先分别以Darknet53和Efficientnet作为YOLOv3的主干特征提取网络进行实验,结果表明以Efficientnet作为主干网络时模型整体性能更好,其定位平均准确度均值和平均识别误差率分别为98.89%、1.57%,检测每张虫害图片仅需0.048s;其次对虫害数据集锚框尺寸进行了分析,通过K-means聚类算法得到本数据集目标框长宽比的分布情况,分别以coco数据集的锚框参数和本文数据集通过K-means聚类得到的锚框参数对YOLOv3、YOLOv3-Tiny、YOLOv4及YOLOv4-Tiny进行实验,结果表明以coco数据集锚框参数训练得到的网络在虫害分类和定位方面的结果均好于以本文虫害数据集通过K-means聚类算法获取的锚框参数训练得到的网络的结果;然后分别对YOLOv3、YOLOv4、YOLOv3-Tiny及YOLOv4-Tiny模型进行了实验并对分类及定位性能进行分析,结果表明YOLOv3-Tiny在虫害目标检测中整体性能优于其他模型,其定位平均准确度均值和平均识别误差率分别为98.52%、1.81%,检测每张虫害图片仅需0.030s。最后对实验结果中出现的检测异常情况进行了分析说明。在后续章节中以YOLOv3-tiny模型得到的结果和其他模型进行虫害目标识别及定位两种性能的比较。(2)在农业生产过程中,对虫害目前所处生长发育阶段及虫害数量等信息的判断可以更精准的分析虫情。但是目标检测算法YOLO只能对虫害目标进行分类及定位,无法提供更加全面的虫害信息。本文以目前效果较好的两级分割模型Mask R-CNN为基础展开研究。首先分别以Res Net50、Res Net101及Mobilenet作为主干特征提取网络对模型进行训练,结果表明以Res Net50作为主干网络时模型整体性能最佳,其虫害目标定位及掩膜的平均准确度均值分别为95.58%、91.90%,平均识别误差率为8.57%,处理每张虫害图片耗时0.16s。其次对数据集可能造成分割异常的图像进行了详细介绍。然后对YOLOv3-Tiny和以Res Net50作为主干的Mask R-CNN模型在分类及定位方面的性能进行了比较,在Io U分别取0.5、0.6、0.75时,YOLOv3-Tiny得到的定位平均准确度均值分别比Mask R-CNN高2.94%、3.99%、24.92%,且平均识别误差率比Mask R-CNN低6.76%,处理一张虫害图片耗时仅为Mask R-CNN的18.75%。最后对实验中出现的异常结果进行了分析说明,并在去除部分产生异常的图像后重新进行模型训练,对比发现虫害目标定位及掩膜平均准确度均值分别提高1.60%、1.06%。在后续章节中以Res Net50作为主干时Mask R-CNN模型得到的结果与其他模型进行分类、定位及掩膜性能的比较(3)Mask R-CNN虽然实现了虫害图像的目标分割,但是在实时性上还有待进一步提高。为了在保证分割准确率的条件下,实现更高的分割效率,本文对单阶段分割模型YOLACT(You only look at coefficients)及其改进版YOLACT++展开相关实验。分别以Res Net50、Res Net101作为主干特征提取网络对YOLACT及YOLACT++模型进行训练及验证,结果表明以Res Net101作为主干特征提取网络的YOLACT++模型具有最优的综合性能。在Io U取0.5时,其定位和掩膜平均准确度均值分别达到95.06%、93.15%,平均分类误差率为12.12%,处理每张虫害图像耗时0.080s。在分类及定位方面,通过比较在Io U取0.5、0.6、0.75时,YOLOv3-Tiny、Mask R-CNN、YOLACT及YOLACT++四个模型的结果,YOLOv3-Tiny具有最好的检测效果,其定位平均准确度均值为98.52%,平均识别误差率仅为1.81%,检测每张虫害图片仅需0.030s。在分割方面,通过对Mask R-CNN、YOLACT及YOLACT++三个模型结果的对比,以Res Net101作为主干特征提取网络的YOLACT++模型整体性能最优,在Io U取0.5时,其掩膜分支平均准确度均值和平均识别误差率分别为93.15%、12.12%,分割每张虫害图像仅需0.080s。最后对结果中的异常情况进行了分析说明,并将出现的异常情况与YOLO和Mask R-CNN中出现的异常进行了对比分析。综上,当仅用于虫害目标检测时选择YOLOv3-Tiny模型,如果需要对虫害的形状特征及数量等进行统计分析,选择以Res Net101作为主干特征提取网络的YOLACT++分割模型。这些方法可以快速高效的对虫害进行识别检测及分割,在给农民对虫害的统计计数以及进行虫害防治带来极大的便利的同时,为后期农作物虫害的预测预警提供数据基础,这对于智慧农业发展过程中虫害问题的解决具有一定的参考意义。
其他文献
本论文提出了PFC与电机驱动磁功能集成化系统,将电励磁磁通切换电机的励磁电感同时当作功率变换器电路电感。电励磁磁通切换电机的励磁电感既给电励磁磁通切换电机提供励磁磁场的同时,又给功率变换电路提供能量缓冲的作用。这给系统的设计带来了挑战:首先,由于这是一个高度集成的系统,其建模不是单纯的独立建模,需整体建模;另外,设计的电励磁磁通切换电机逆变器与功率因数校正电路之间存在一定的耦合关系。本文首先利用功
在21世纪这个信息时代,信息的获取、处理、储存和传输等技术受到了广泛的关注。随着微纳光集成器件制作工艺的日趋成熟,微环谐振器以其尺寸小、损耗低等优点已经成为目前研究的热点器件并在光学滤波、传感以及声光调制、探测等各种领域得到了广泛的应用。设计微环谐振器结构以及分析其对光场和声场等物理场的响应特性对于提升系统的性能具有很大的研究意义。本文基于微环谐振器的光学和声学性能,首先分析微环谐振器的光传输特性
忆阻器是一种具有记忆特性的非线性电阻,在新一代非易失存储器、非线性电路、人工神经网络和逻辑运算等领域有着重要的潜在应用。2005年Chua提出局部有源是复杂性的起源,之后又提出局部有源忆阻器的概念。忆阻器可分为局部无源忆阻器和局部有源忆阻器,局部无源忆阻器可以模拟突触特性,局部有源忆阻器可以模拟神经元的功能。复杂和丰富的动力学行为仅出现在局部有源系统之中,而且研究发现工作在混沌边缘机制下的神经网络
随着现代科技的发展,模糊数学的应用越来越广泛,在金融领域中的作用也日益显现。由于受到金融市场波动性和人们主观因素的影响,现实世界中的无风险利率、波动率和股票价格可能会存在不确定性属性。换言之,在金融活动中,许多案例不仅涉及一些无法确定是否发生的事件,而且涉及一些概念界限不明确的数量。例如,在二叉树模型中,股票在下一时刻的价格通常只是一个预测数量,它只是对未来某个数量的估计。在讨论模糊环境下的一些金
Buck降压电路是非隔离型功率变换器基础的电路拓扑之一,它具有电路结构简单,输出电流脉动小等优点,广泛应用于各种电能转换场合。输出电压纹波与电能转换效率是判别开关电源质量优劣的重要因素,较大的输出电压纹波会恶化输出电能质量,甚至引起电磁兼容问题,降低输出电压纹波是提高Buck变换器性能的关键。伴随着第三代宽禁带器件在功率变换器中的进一步普及应用,电源效率也得到了进一步的提高。本课题是基于以上所述背
四联因素学说指出龋病是细菌、食物、宿主和时间共同作用下的一种慢性、进行性、破坏性的牙齿硬组织疾病。致龋细菌与食物残渣黏附在牙齿表面形成牙菌斑生物膜,其新陈代谢产生酸性物质腐蚀牙齿导致龋损,因此可认为龋病是牙齿宿主与外部因素相互作用的结果。一方面,现有的龋病风险评估系统侧重细菌、食物、患龋经历、家庭经济等因素,尚未充分考虑牙齿宿主的形态因素对患龋风险的影响。另一方面,牙齿咬合面窝沟区域形态复杂,易于
跳变系统作为一种特殊类型的混杂系统,因为其模型可以广泛应用在各种现实场景中,从而受到了研究者们的广泛关注。而作为跳变系统的典型代表—马尔可夫跳变系统/半马尔可夫系统在现代航空航天、工业控制、市场经济、无线电网络等领域已经有了非常广泛的实际应用。跳变系统的控制一直是该领域的热点研究方向,但由于非线性干扰、网络攻击等因素的影响,跳变系统的控制难度加大。另外,考虑到在网络环境下的跳变系统控制会受到网络带
随着工业技术的发展和人民生活水平的提高,制冷设备和技术广泛用于各行各业和千家万户,其占社会能源消耗的比重越来越大,约占社会总能源消耗的15%,制冷设备能源的使用效率问题,已经成为社会关注的热点。制冷设备的大量使用,故障发生的概率随之增加,设备带故障运行,必然导致能源效率明显下降。如何快速准确的完成制冷系统的故障检测与诊断就显得极为重要。本文旨在寻求一种高效稳定的故障检测与诊断方法,围绕制冷系统展开
复杂系统的安全性评估是确保安全平稳运行,避免严重事故和生命财产损失的重要手段。其评估过程需要处理多种不确定性信息以及多个因素间的非线性关系,且评估模型需要具有可解释性。置信规则库方法能够表达和推理各种不确定性信息,对非线性复杂系统进行建模,且建模和推理过程可解释性强。目前的置信规则库仅在单一的交集或并集假设下建立,但实际复杂系统安全性评估建模会出现交集和并集假设混合的较为复杂的情况。提出混合置信规
自帕累托效率被提出以来,多属性决策思想便开始融入人们生活的各个领域。事物越复杂,模糊性越强,在进行多属性决策时,所面对的不准确、模糊信息越难筛选。怎样有效解决模糊多属性问题对现在的社会工作来说变得非常重要。本文首先在离散模糊数的基础上进行拓展,提出了拟离散模糊数及其向量的概念。讨论了拟离散模糊数的相关定理及其性质,定义了拟离散模糊数及其向量的质心,建立n维拟离散模糊数向量空间上的弱序。基于我们建立