论文部分内容阅读
网约车作为我国公共交通系统的补充,在提升城市交通运力以及缓解出行压力方面,发挥着越来越重要的作用。针对网约车数据的研究,旨在提高网约车在时间和空间上的平衡合理分布,满足人们日常出行需要,同时,改善交通拥堵现状。短时交通流预测是智慧城市建设过程中的重要环节。本文以网约车订单等真实数据为数据源,结合TensorFlow深度学习框架,基于正则优化的循环神经网络(RNN)方法,预测网约车在未来某时间、某地点的订单需求量。本文基于网约车数据源的短时交通流量预测模型进行了深入探讨和研究,数据量较大且依赖关系不明确,因此提出对其进行可视化和预测方法的研究。本文首先阐述短时交通流量预测的概念、研究目的和意义、研究内容和方法,按照参数化方法和非参数化方法两个方面综述了国内外短时交通流预测技术。第二,分析网约车数据源,介绍了数据预处理方法,解决数据来源质量问题,以此为基础结合可视化理论,判别多维度间相关性强弱。第三,提出了基于RNN的OC-LSTM RNN(Online Car Long Short-Term Memory Recurrent Neural Network)模型,该模型结构包含输入层、循环体和输出层,循环体包含门结构,可以预测网约车未来某时间、某地点的供需缺口。第四,验证提出的预测模型的有效性,并优化结构。本文的主要研究成果包括:1)提出网约车数据的可视化方法针对网约车数据源维度较多、数据量较大、重复数据干扰等特点,提出基于TensorFlow框架和科学数据可视化理论的网约车数据可视化方法。首先,基于TFRecord数据格式转换,清除数据源中的重复或无效数据;计算网约车订单的供需缺口值;结合科学数据可视化分析理论和供需缺口值,可视化网约车数据源中的各维度关系。为OC-LSTM RNN算法提供数据支撑。2)提出基于网约车数据可视化、正则的OC-LSTM RNN算法基于1)的可视化分析,结合循环神经网络和正则优化方法,提出OC-LSTM RNN算法。首先,阐述RNN的基础理论,结合长期依赖问题,研究长短时记忆循环神经网络的时间复杂度和计算能力。然后,结合网约车数据可视化分析、正则优化的原理,提出基于状态向量传递、神经元节点控制的OC-LSTM RNN算法。在网约车供需预测问题上取得较高精度。3)通过实验挖掘OC-LSTM RNN的泛化能力及其最优配置OC-LSTM RNN与4种对比算法比较在测试数据集上的均方根误差(RMSE)值。实验表明,OC-LSTM RNN在网约车供需预测问题上具有良好的表现。基于仿真实验,发现RMSE最小时的最优隐藏节点数量为68和最优截断长度为2。最优配置下,OC-LSTM RNN的预测精度最高。