论文部分内容阅读
大眼金枪鱼(Thunnus obesus)是大西洋热带海域金枪鱼延绳钓渔业的重要捕捞对象之一,探索不同渔情预报模型在大西洋大眼金枪鱼渔情预报中应用的效果,具有重大意义。本研究基于2016~2019年中国渔业企业在大西洋(14°20′S~15°20′N;47°38′W~2°30′E)作业的13艘延绳钓渔船渔捞日志数据,分析了大眼金枪鱼渔场的月间分布变化,结合海表面风速、叶绿素a浓度、涡动能、温跃层深度和0~500 m水层的垂直温度、盐度和溶解氧等海洋环境变量,以天为时间分辨率、2°×2°为空间分辨率建立了一系列大眼金枪鱼渔情预报模型。通过计算各个环境因子与CPUE间的Sperman相关系数筛选出与CPUE显著相关的环境变量,其次利用VIF方差膨胀因子去除每个环境变量之间的共线性,从而提高模型预测的准确率和运行效率。为建立渔情预报模型,将CPUE按照三分位数法划分两类,CPUE大于10(第一三分位数)的为高CPUE渔区,CPUE小于10的为低CPUE渔区。以数据集的75%为训练数据建立了k最近邻(K Nearest Neighbor,KNN)、逻辑斯蒂回归(Logistic regression,LR)、分类与回归树(Classfication And Regression Tree,CART)、支持向量机(Support Vector Machines,SVM)、人工神经网络(Artificial Neural Networks,ANN)、随机森林Random Forest,RF)、梯度提升决策树模型(Gradient Boosting Decision Tree,GBDT)和Stacking集成(由k最近邻、随机森林、梯度提升决策树模型集成)模型。将25%的测试数据输入各模型中计算其预测准确率和ROC(Receiver Operating Characteristic)曲线下面积,确立相对最优模型。将25%的测试数据中的实际高CPUE渔区与预测能力最好的模型的预测高CPUE渔区进行叠加,将实际低CPUE渔区与预测低CPUE渔区进行叠加,定性分析预测能力最好的模型的预测性能;使用Arcgis软件画出25%的测试数据中的实际“高CPUE渔区”位置密度分布图并与预测能力最好的模型预测得到的“高CPUE渔区”位置密度分布图进行比较,定性分析预测能力最好的模型的预测性能。使用Arcgis软件画出25%测试数据中的实际“高CPUE渔区”位置密度分布图,以及各模型预测的“高CPUE渔区”密度分布图,把密度大于9.0个/km2的范围定义为中心渔场,定性比较各模型预测中心渔场分布与实际中心渔场分布是否一致。研究结果如下:(1)2016~2019年大西洋热带海域大眼金枪鱼1~3月的CPUE相对较高,主要分布在3°N~15°N,30°W~45°W的海域,从3月开始渔场向南方移动,大眼金枪鱼CPUE逐渐降低,4~5月大眼金枪鱼渔场分布比较广泛,在15°N~15°S,3°E~50°W海域,7~9月大眼金枪鱼的CPUE最低,集中分布在10°N~15°S,2°W~35°W海域,随后9~12月大眼金枪鱼渔场开始向北方移动,CPUE逐渐增加,其主要分布在10°N~15°S,15°W~50°W的海域。从CPUE分布来看,高CPUE渔区集中分布在0°N~15°N,30°W~50°W的海域。(2)叶绿素a浓度、温跃层深度、海表面风速、涡动能、垂直温度、垂直溶解氧和垂直盐度均与大眼金枪鱼CPUE显著相关,相对重要性合计为:2.15%、5.21%、5.39%、1.75%、23.77%、46.23%和14.49%。其中200─400 m水层的溶解氧对大眼金枪鱼渔场的分布最为密切,相对重要性累计达到35.57%;500 m水层的盐度、海表面风速和温跃层深度相对重要性都达到了5%以上;0~500 m水层的温度中,200 m、250 m水层的温度相对重要性比其他水层高,合计达到9.35%,而海洋表面温度的相对重要性最低,为0.47%,对大眼金枪鱼渔场分布的影响极小;叶绿素a浓度和涡动能的相对重要性分别为2.15%和1.75%,对渔场的分布影响较小。(3)由KNN、RF和GBDT等初级学习器通过Stacking集成算法得到的集成模型的预测性能要优于KNN、LR、CART、SVM、ANN、RF、GBDT等单一模型。Stacking集成模型的预测精度为81.62%,ROC曲线下面积为0.781;KNN的预测精度为79.44%,ROC曲线下面积为0.778;LR的预测精度为72.81%,ROC曲线下面积为0.685;CART的预测精度为74.84%,ROC曲线下面积为0.716;SVM的预测精度为73.67%,ROC曲线下面积为0.701;ANN的预测精度为67.70%,ROC曲线下面积为0.631;RF的预测精度为78.13%,ROC曲线下面积为0.746;GBDT的预测精度为81.62%,ROC曲线下面积为0.781。(4)Stacking集成模型对高CPUE渔区的预测精度为72.10%,对低CPUE渔区的预测精度为86.84%;KNN对高CPUE渔区的预测精度为73.20%,对低CPUE渔区的预测精度为82.84%;LR对高CPUE渔区的预测精度为56.43%,对低CPUE渔区的预测精度为80.63%;CART对高CPUE渔区的预测精度为65.52%,对低CPUE渔区的预测精度为80.03%;SVM对高CPUE渔区的预测精度为60.35%,对低CPUE渔区的预测精度为80.03%;ANN对高CPUE渔区的预测精度为58.31%,对低CPUE渔区的预测精度为72.18%;RF对高CPUE渔区的预测精度为69.28%,对低CPUE渔区的预测精度为86.76%;GBDT对高CPUE渔区的预测精度为65.05%,对低CPUE渔区的预测精度为84.44%。研究表明基于八种模型的大西洋大眼金枪鱼渔情预报精度各不相同,其中随机森林和Stacking集成模型的总体预报能力较优,而K最近邻在高CPUE渔区预报上表现较好,其他模型预报能力表现较差。建议当样本数据较多且复杂时使用随机森林和Stacking集成模型;当数据较少且简单时,K最近邻在渔情预报方面具有较大优势。