论文部分内容阅读
交通拥堵状态的准确预测是智能交通系统的核心目标之一。城市交通状态具有一定的自相似性规律可以用于预测;但是道路和环境因素产生的路段多样性和外部因素干扰产生的路网动态性,使得全路网拥堵规律具有高度复杂性和不确定性。预测模型不仅需要适应复杂路网情况,实现高精度预测,而且需要根据路网环境变化,实现高效率更新,但传统方法在准确率和学习效率两个方面存在明显不足。本文提出神经网络群组快速学习方法,将大规模数据上的复杂学习问题转化为大量中小规模数据子集上的简单学习问题,在大量不同特点的路段子集上利用超限学习机算法快速训练子预测模型,从而建立城市路段全范围覆盖的拥堵预测群组模型,充分发挥超限学习机算法在小规模子集上准确度高、训练速度快、参数少、易于并行加速等优点,实现对大规模交通拥堵数据的高精度、高效率学习。第一,提出了神经网络群组快速学习方法,以路段属性特征划分数据子集,以拥堵现象特征训练子预测模型,通过共享网络简化群组存储,提升了交通拥堵预测模型的全路网预测准确率和模型训练效率。该算法将大规模复杂综合预测问题简化为大量小规模简单路段预测问题,利用大量超限学习机对各个子集进行快速训练;群组中各子模型数据独立,可以运用多进程并行运算提升运行速度。群组通过集成各个路段集合上的子预测器,组成全路网整体预测模型。第二,提出基于变差系数加权的聚类划分算法,解决了枚举划分神经网络群组枚举类型缺失、子集数据覆盖率不足、连续性数值特征划分不合理等问题。变差系数权值修正了样本距离计算方法,用差异化的标准衡量不同维度特征上的数据偏离程度,优化聚类划分;基于聚类的子集划分方式,适应了数值型数据的空间分布特点,可以准确划分训练集中缺失的路段类型,并选择近似的子模型进行预测;模糊聚类方式扩大了子集数据来源,提升了低覆盖率路段的预测准确率。预测模型通过两种划分方式的组合,并依据覆盖率高低分工预测,实现了预测高精度全路网覆盖,无死角。第三,提出衰减加权超限学习机算法,解决了拥堵预测的不平衡问题,在不同平衡性分布的路段子集上提升少数类拥堵情况的预测准确率,并保持整体模型的预测精度。本文对比分析了混合采样和加权优化的方法,并在子模型训练上提出新的衰减权值设置模式。该模式在侧重少数类识别的同时兼顾子集划分对多数类的分类偏重,有差异地分配各类别样本的分类权重,提升了超限学习机训练的神经网络在子集数据不平衡情况下的识别准确率;从而使群组可以适应不同平衡性的数据集,提升高峰时段拥堵预测准确率,同时维持整体分类准确率。最后,本文以神经网络群组快速学习方法为核心,结合Web地图服务、浮动车技术、数据库技术等,建立了以全市交通路网拥堵预测为主、以交通评估、道路规划辅助、拥堵疏导建议为辅的交通拥堵评估与预测系统。实际应用中,多个拥堵预测模型训练高效,连续预测符合真实交通路况。系统给城市交通疏导和道路规划提供了有效支持,展现了神经网络群组方法良好的应用前景。