论文部分内容阅读
在机动车数量不断突破新高的大背景下,交通拥堵已成为制约社会发展的重大问题。如果能准确预测路网中各路口的交通流量,相关部门则可以制定更有针对性的疏导措施,从而全方位提升路网利用率,缓解交通拥堵问题。近些年,数据挖掘技术取得了重大进展,该技术与交通流量预测场景的结合令人憧憬。本文基于数据挖掘技术,对交通流量进行分析和预测。第一,以聚类技术为切入点,提出交通流量模式挖掘方法。综合考虑轮廓系数、Calinski-Harabaz 指数和 Davies-Bouldin 指数,利用 K-Means 和Agglomerative Clustering算法确定交通流量模式个数,将交通流量模式分为单峰和双峰两种类型,验证得出节假日与工作日分别对应不同的流量模式,并根据模式对数据集划分,再进行预测。第二,对应不同的原始数据,分别提出基于深度学习的流量预测模型。其一,在仅提供单监测站信息时,传统循环神经网络无法处理交通信息拼接后的无时序性。为了解决这一问题,本文提出Combined-Update Gate Recurrent Neural Network(CUGRNN)模型,利用多个循环神经网络提取交通信息的时序特征。其二,当额外提供上下游监测站信息时,随着输入序列数量增加,CUGRNN复杂度急剧上升,且无法学习监测站间的位置关系。为了解决这一问题,本文提出了 Convolutional-UGRNN(Conv-UGRNN)模型,利用卷积神经网络捕获监测站之间的空间关系并使模型简化。第三,为了解决交通数据集样本数量受限的问题,本文提出基于卷积自编码器(Convolutional Auto-Encoder,CAE)的交通信息数据增强方法。该方法考虑到不同交通信息之间的内在联系,整体重构数据,使CUGRNN和Conv-UGRNN学习到更多的变化规律,提高模型的准确性。实验结果表明,交通流量模式划分提高了训练集的纯度并降低了预测模型的拟合难度;与现有文献中的交通流量预测算法相比,本文提出的CUGRNN和Conv-UGRNN网络结构更加合理,准确性更高;基于CAE的交通数据增强方法行之有效,进一步提升模型的准确率。