论文部分内容阅读
随着现代化的强劲步伐,尤其是民航运输业的快速发展,同时伴随着人工智能、大数据技术等数据信息技术的高速变革。其深度学习技术已经服务于各行各业。针对民航运输业延误率较高,传统算法难以满足高精度延误预测的问题,提出基于大数据的深度学习方法进行航班延误的高精度预测。旨在通过高效智能的深度学习算法挖掘数据背后的客观规律。并且将其预测结果进行可视化展示,为智慧民航提供决策参考。论文主要工作内容如下所示:首先,针对传统算法模型使用的数据量较小,数据维度较低等问题。论文结合实际中可能对航班产生影响的因素,考虑了包含航班信息、天气信息、关联机场等高维度的海量数据进行航班延误预测。先对国内外数据集的特征属性进行介绍,再分别进行数据预处理操作,利用主键关联的方式将各个维度的特征属性融合,最终转换成输入到模型中的特征矩阵。其次,针对航班延误预测模型需要的较强的数据处理能力,以拟合高维度的海量数据,提出一种团簇随机连接网络(Randomly Connected Clique Network,CliqueNet)航班延误预测模型,以仿生网络结构对海量航班数据背后的客观规律进行特征提取,最终以Softmax分类器给出最终的航班延误等级的高精度预测。主要有以下两点创新:(1)提出团簇特征层随机连接,以更为有效的连接方式传递特征信息;(2)在转换层引入通道和空间注意力残差(Channel-wise and Spatial Attention Residual,CSAR)模块,以自适应特征提取的过程,从通道和空间两个维度对特征值进行双重标定。美国数据集上实验表明,对团簇进行随机连接和引入CSAR模块准确率分别提高0.5%,1.3%,模型最终的准确率达93.40%。此外,以国内虹桥机场的数据作为实验数据,融合编码后进行航班延误预测,该模型最终预测准确率达到94.5%。最后,对航班延误数据进行可视化界面展示。航班延误可视化界面主要结合Highcharts等大数据可视化插件给出数据的可视化展示,并且结合地图展示全国航班延误等级展示。先对大数据可视化的趋势和信息可视化技术做出了介绍,然后,主要按照延误地图可视化、航班信息可视化、航班延误可视化等几个重要部分进行可视化方法的研究和可视化分析展示,有效的为民航空管部门提供辅助决策。