论文部分内容阅读
在过去的20年中,由于沿海经济的高速发展,海洋富营养化状况日益严重,赤潮发生的频率、影响规模都在不断扩大。探索赤潮的形成机理,对于预测预报赤潮、减少赤潮的损害十分关键。由于浮游植物总量是赤潮发生的标志,以2003年5-9月的实测数据作为样本,浮游植物总量为因变量,其它14组环境数据为预报因子,通过多元回归技术,给出它们的定量关系,从而确定影响藻类浓度的关键因子以及临界值。
多元回归方法很多,本文选用回归树的髓机梯度Boosting算法,该算法将梯度下降技术应用于回归树中,而且融入Bagging的思想,大大提高了预测的精度。分析最后得到的模型可以知道对浮游植物总量影响大小依次为气压>磷酸盐>pH>DO>表层水温>叶绿素>风速>硅酸盐>亚硝酸盐>盐度>铵盐>化学耗氧量>硝酸盐,而且天气(晴天,阴天,雨天)几乎不影响浮游植物总量。为了比较其它算法,综合考虑了支持向量回归,人工神经网络,MARS(multivariateadaptiveregressionsplines),投影寻踪回归,回归树,从预留的三个数据的预测值与实测值的相对误差可以知道,绝对损失函数的随机梯度Boosting算法比起其它方法更稳健。