基于XGBoost的常规公交短时客流预测研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:jian47312144
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着出行需求以及道路运行状态波动性的不断加剧,短时常规公交需求预测已成为研究热点。可靠的短时客流预测能够帮助调整常规公交线路班次计划,并为乘客出行多样化提供服务,从而提高乘客满意度和经济效益。数据波动性直接影响预测精度,公交客流数据主要依据公交刷卡数据推算,而刷卡数据直接受公交车达到情况的影响,因此为了降低数据波动性的不利影响,减小预测误差,本文以车辆到达数、时段、相邻前时段客流、工作日与非工作日等因素作为特征输入,构建了基于XGBoost的常规公交短时客流预测模型。主要工作如下:(1)推算客流数据。由于乘客刷卡数据受车辆到达影响,无法真实反映乘客到达实际情况。为尽可能得到真实客流数据,在假设乘客到达为均匀分布的基础上,本文将车辆在某站点上车乘客数量平均分配到前一班次离开至当前班次到达时间段上,以此作为客流数据。并通过与站点上车人数的客流时间分布曲线对比分析,发现推算得到的客流数据曲线直观上更为平稳。(2)客流波动及其影响因素分析。首先,分析了短时客流的波动性;进一步,通过多条线路的车辆到达数与所选线路客流的相关性分析,对客流波动的影响因素进行了探究,发现影响线路客流波动的主要因素为车辆到达数;最后,对短时客流的时间分布规律进行了研究,得到纵向上相邻前4个时段客流相关性较大,相关系数在0.4以上,横向上工作日与非工作日客流在时间分布上显著区别,并且随时段变化而变化。综上所述,本文以车辆到达数、时段、相邻前时段客流、工作日与非工作日等因素作为短时客流预测模型的特征输入。(3)构建常规公交短时客流预测模型。在模型输入数据集中,车辆到达数变量个数偏多,时段变量个数偏大且呈现稀疏特点。由于XGBoost能有效解决数据高纬度且稀疏的问题,进而提高算法效率,因此本文提出建立XGBoost模型进行短时客流预测。在模型构建过程中,首先,进行特征工程,将本文选用的特征转化为适用于模型学习的输入数据集,其中时段特征为类别型变量且变量数较多,需要对其进行独热编码操作;进一步,进行模型调参,使用网络搜索交叉验证法为XGBoost模型中通用参数、提升参数和学习任务参数选择最佳取值。(4)算例分析。本文选用广州市常规公交单峰类型、双峰类型、其它类型共30条线路一个月前27天的相关数据构建XGBoost预测模型,并选用后3天的相关数据作为测试集进行模型结果验证。首先进行模型有效性分析,通过与KNN回归模型、BP神经网络模型、LSTM模型对比,本文所构建的XGBoost模型均方根误差由6.03、5.70、6.17提升至4.76,计算时间由11.78s、40.21s、28.15s提升至10.63s,由此得到XGBoost预测模型能够更快速并准确预测常规公交短时客流;另外车辆到达数不作为特征输入时,模型均方根误差误差下降至5.46,由此得到车辆到达数特征作为模型特征输入可以有效提高预测精度。最后进行模型灵敏度分析,XGBoost预测模型在高峰时段的平均绝对百分比误差优于低峰时段,因此得到本文所构建的XGBoost预测模型在高峰时段的预测效果良好。
其他文献
汽车的智能化已经成为汽车未来经济发展趋势。为了在行驶过程中实现汽车的动态控制,需要估计对车辆的关键状态参数,包括速度、质心侧角等。由于汽车的控制过程非常复杂,并且可以直接应用与车身的传感器非常有限,某些关键参数无法直接获取。因此,需要根据实际应用设计相应的状态参数估计器,以解决车辆控制中数据采集的问题。为了估计器能够适用于每一个工况,本文研究了在行驶条件下状态估计和参数识别的方法,为车辆的安全性和
随着化石能源的日渐枯竭和环球环境的日益恶化,传统电力系统的能源结构已经不适应未来能源发展的需要。综合能源系统利用先进的能量转换技术聚集风能、太阳能、地热能、天然气和生物质能,并传输和转换给冷、热、电及其它形式的用户消费,是代表未来可持续发展的智能电网前沿系统。然而,当前成熟的调度技术主要面向传统能源和负荷,不适应天然气和生物质能等接入后的系统调度需求。调度是确保系统运行经济和环保的首要环节。因此,
安全生产是企业长久发展的生存准则。作为保障城市安全稳定供气的公共事业企业,安全始终是最高运营准则。深圳市6400多公里的中压管网是深圳燃气与人民群众连接的重要纽带,做好中压燃气管网的安全保障工作是深圳燃气安全生产的重要环节。随着深圳市城市建设步伐的不断加快,轨道交通、雨污分流、优质饮用水改造等大型施工项目遍地开花,第三方施工工地数量大幅增长。据统计,2017年的地下中压管网周边施工工地数量突破90
智能楼宇自动控制技术随着科技的发展,具备的各项功能也逐步增多,它是一个结合了如传感技术、通讯技术、计算机技术等多种技术的先进技术。目前使用较多的楼宇控制主要分为有线及无线两种方式进行部署,有线传感网络组成的监测系统具有施工难度高,维护成本高,已逐步被市场淘汰。而无线传感网络组成的监测系统方便部署,具有易维护的作用,该无线网络支持的通讯技术有Wi Fi、蓝牙、4G、Zig Bee等等,适用范围广泛,
化石燃料的日益稀缺使得太阳能、风能和潮汐能等新能源的开发和利用迫在眉睫,利用新能源进行并网发电成为缓解能源危机的重要举措。并网逆变器作为新能源与电网之间的重要电能转换装置,其性能直接影响到入网电能质量。另一方面,随着半导体材料的不断开发和发展,以Silicon carbide(Si C)和Gallium nitride(Ga N)为代表的宽禁带(WBG)半导体器件在并网逆变器中的广泛应用虽然可以减
目前我国建筑业发展迅速,但是生产效率较低。造成这种情况的重要原因之一是国内工程项目的规模不断增大、建筑形态及施工工艺也越来越复杂,传统的工程项目管理模式存在不能及时有效获取工程数据以及数据缺失等问题,无法实现建筑业的精细化及信息化管理。基于BIM的工程项目管理可以提升传统工程项目管理获取相关工程数据的效率,为改变建筑业及工程项目管理现状带来了契机。BIM获取工程项目数据的实际效果并不理想,其中一个
随着我国城市的迅速发展,公共建筑的数量和交通流量不断增加,建筑高能耗与交通拥挤的问题日益突显,建筑节能和交通规划已成为当今新型智慧城市的一项研究重点。准确的能耗预测与交通量预测是当今建设智慧城市的重要前提,通过对预测结果进行分析,可以为建筑节能与交通状况判别提供决策依据。随着信息技术的发展,计算机和数学领域涌现出了多种功能强大的预测算法,有望实现自动化、精细化、数据驱动的多领域实测数据预测。然而,
六自由度动磁式磁悬浮平面电机具有大行程、结构简单、精度高等特点,其动子由永磁体阵列组成,可实现六自由度无接触式运动,其定子由多层印制电路板制作而成,相对于传统绕组线圈减小了加工误差,因此在精密制造等领域具有良好的工业应用前景。针对六自由度动磁式磁悬浮平面电机的电磁力耦合、系统多输入多输出的控制难题,论文深入研究其电磁力模型、电磁力解耦控制方法和六自由度运动控制方法。论文主要研究工作概略如下:首先,
在全球环境不断恶化,化石能源日益枯竭的背景下。世界各国政府纷纷出台了相应政策来激励电动汽车产业的发展,电动汽车逐渐成为未来汽车发展的主流。而车载充电机作为电动汽车电能补充的关键设备,直接影响着汽车的充电时间以及续航里程。因此,设计符合高可靠性、高效率、以及高功率密度要求的车载充电机,对提高电动汽车普及率起着重要作用。在对车载充电机的相关技术指标进行调研后,对基于Ga N功率器件的两级式车载充电机进
目前城市道路信号交叉口的信号配时方案优化设计,主要以交叉口总延误最小为目标。但随着社会的发展,环境恶化、社会资源分配不均匀等问题的影响越来越突出,在交通上则具体表现为机动车尾气排放增加、各相位车均延误不公平。因此以排放、公平性为切入点,运用比功率测算排放、信息熵衡量各相位车均延误公平性,在深入的可行性分析基础上分别构建了考虑延误与排放、延误与各相位车均延误公平性、排放与各相位车均延误公平性的信号配