论文部分内容阅读
台风(热带气旋)给我国东南沿海各省市的工农业生产、交通运输和人民生命财产安全造成严重威胁。因此,台风风速(强度)的估计和预报是事关国家财产和人民生命安全的重大问题。然而,基于气象学的热带气旋定强方法在准确性和自动化方面仍有不足。本文采用机器学习和图像处理技术,利用先进的半监督学习方法实现热带气旋强度估计,主要研究内容如下:
1、将热带气旋强度估计问题描述成一个分类问题,将热带气旋强度等级当作类别标签,从而提出一种基于全监督集成学习的热带气旋定强框架,从卫星云图估计气旋的强度等级(即类别)。全监督分类器分别采用多类逻辑回归(Multiple Logistic Regression,MLR)、支持向量机(Support Vector Machine,SVM)和反向传播神经网络(Back-Propagation Neural Network,BPNN),在风云4号(FY-4)卫星的多光谱图像上验证了该框架的定强效果,并对各个全监督模型的性能进行了对比。
2、全监督方法需要大量的先验样本进行训练,然而实际中只有少量的标记样本可以使用。针对此问题,本文提出了基于BPNN的半监督热带气旋定强算法,用少量带标签的样本就可以准确地估计热带气旋强度。该框架首先通过半监督分类得到热带气旋的风速类别,然后在分类基础上进行半监督的风速回归。并且,基于图像级欧氏距离和直方图距离,设计了一种混合距离,用于筛选置信度较高的无标记样本用于更新训练集,实现半监督分类。在风云4号多光谱数据(2000米分辨率和4000米分辨率)、红外图像(Infrared Imagery,IR Imagery)三个数据集上对基于反向传播神经网络的半监督热带气旋定强算法进行了验证和分析,实验结果表明该方法的风速估计误差低于经典风速估计算法。
3、相较于反向传播神经网络,卷积神经网络(Convolutional Neural Networks,CNN)可以有效提取图片的空间信息。因此,本文提出一种基于CNN的半监督热带气旋定强算法。该算法使用两个CNN网络以及上述混合距离度量对热带气旋强度进行先后进行半监督的分类和回归。在上述三个数据集上,所提方法表现出优越的性能,其风速估计误差低于经典风速估计算法以及基于BPNN的半监督算法。
由本文的工作表明,基于机器学习的图像处理技术能够实现卫星云图分析和气旋风速估计,本文所提出的半监督模型能够有效提升气旋强度分类和风速估计的精确度,在热带气旋定强和风俗预测中有良好的应用前景。
1、将热带气旋强度估计问题描述成一个分类问题,将热带气旋强度等级当作类别标签,从而提出一种基于全监督集成学习的热带气旋定强框架,从卫星云图估计气旋的强度等级(即类别)。全监督分类器分别采用多类逻辑回归(Multiple Logistic Regression,MLR)、支持向量机(Support Vector Machine,SVM)和反向传播神经网络(Back-Propagation Neural Network,BPNN),在风云4号(FY-4)卫星的多光谱图像上验证了该框架的定强效果,并对各个全监督模型的性能进行了对比。
2、全监督方法需要大量的先验样本进行训练,然而实际中只有少量的标记样本可以使用。针对此问题,本文提出了基于BPNN的半监督热带气旋定强算法,用少量带标签的样本就可以准确地估计热带气旋强度。该框架首先通过半监督分类得到热带气旋的风速类别,然后在分类基础上进行半监督的风速回归。并且,基于图像级欧氏距离和直方图距离,设计了一种混合距离,用于筛选置信度较高的无标记样本用于更新训练集,实现半监督分类。在风云4号多光谱数据(2000米分辨率和4000米分辨率)、红外图像(Infrared Imagery,IR Imagery)三个数据集上对基于反向传播神经网络的半监督热带气旋定强算法进行了验证和分析,实验结果表明该方法的风速估计误差低于经典风速估计算法。
3、相较于反向传播神经网络,卷积神经网络(Convolutional Neural Networks,CNN)可以有效提取图片的空间信息。因此,本文提出一种基于CNN的半监督热带气旋定强算法。该算法使用两个CNN网络以及上述混合距离度量对热带气旋强度进行先后进行半监督的分类和回归。在上述三个数据集上,所提方法表现出优越的性能,其风速估计误差低于经典风速估计算法以及基于BPNN的半监督算法。
由本文的工作表明,基于机器学习的图像处理技术能够实现卫星云图分析和气旋风速估计,本文所提出的半监督模型能够有效提升气旋强度分类和风速估计的精确度,在热带气旋定强和风俗预测中有良好的应用前景。