论文部分内容阅读
城市公共交通系统是由多种公共交通方式组成的有机整体,城市轨道交通与常规公交均为该系统的重要组成部分。城轨新线开通对常规公交客流影响较为复杂,常规公交与城轨站点间距离、线路位置关系乃至城轨站点周边用地性质,都会对城轨周边常规公交客流量造成影响。在城轨开通之前合理预测周边常规公交的客流变化情况,及时进行调度优化,能够有效地利用城市公共交通资源。本文以常规公交与城轨的客流影响关系为基础,利用机器学习与统计分析的方法,建立了城轨新线开通后的周边常规公交站点客流预测模型,采用北京地铁6号线延线及8号线南段开通前后的常规公交客流数据进行了实例验证。主要研究内容分为以下三个部分。(1)建立了基于机器学习的城轨新线开行下常规公交客流预测BPMFS(Prediction of Bus passenger Flow under new Subway line based on Machine learning)模型。首先对城轨新线对常规公交客流的影响因素进行分析,并以此为依据进行特征选取,然后利用最大信息系数MIC进行特征重要性的评估,并根据评估结果进行特征构造,最后结合贝叶斯优化建立了最优超参数集成回归树Xgboost预测模型。(2)针对BPMFS模型中常规公交站点客流分布规律难以识别的问题,设计了常规公交站点客流序列聚类W-shape算法。该算法针对常规公交客流序列的一般性质,设计了加入正则项的时间序列相关性衡量方式RSBD(Regular and Shape Based Distance),在综合考虑时间序列形状与幅度的基础上,设计了新的聚类中心提取方式SBC(Shape Based Center),并通过算例证明了W-shape是一种可用于常规公交客流序列识别与聚类的高效模型。(3)在实证研究中,进行了数据清洗、现状分析、特征构造、特征评估、模型训练与预测,以北京地铁6号线延线周边常规公交客流数据作为模型训练集与测试集,8号线南段作为模型验证集,验证了BPMFS模型的有效性:MAPE为0.059,RMSE为4.607,R2_score为0.938。图15幅,表28个,参考文献66篇。