论文部分内容阅读
随着高速公路的不断建设,路网逐渐被完善,高速公路网已经成为我国的经济命脉,收费系统作为高速公路建设的重要组成部分,记录了大量车辆的收费数据。随着大数据分析与人工智能等技术的不断进步,数据挖掘也被逐步地引入交通运输领域,使得智能交通进一步发展。如何将高速公路收费系统中的数据充分利用,挖掘出有价值的信息,为交通出行者和道路管理者提供可靠的信息,为智能交通发展提供理论支持成为高速公路进一步发展的方向。本文以此为出发点,通过对高速公路收费数据的挖掘,探究路网交通运行状态,为出行者与交通管理者对道路状态评价提供数据支持。1、高质量的数据可以提高数据挖掘的准确度,合理的数据处理方法可以获得更多有效信息。因此数据挖掘前需要对数据进行预处理。先通过数据清洗、集成、抽取和剔除异常值,以生成初步有效的数据,采用四分位法和统计学原理对数据进行筛选,实验结果表明采用统计学原理上限和四分位法下限范围内数据可以包含大多数有效数据。有效数据筛选为下一步研究打下基础。2、现有论文进行高速公路运行状态判别时,常采用密度、速度、车头时距等作为交通流特征参数。该数据的收集需花费大量成本且存在较大误差。高速公路收费数据精确记录了车辆进入、离开收费站的时间,能够精确计算车辆在路段中的行程时间,误差较小。然而这部分数据无法直观反映车辆在行驶路段中某时段的交通状态,本文就此展开讨论,将行程时间“可靠度”与“交通运行状态”相结合,采用畅通可靠度、基本畅通可靠度和轻度拥堵可靠度作为路段的特征参数,对路段交通状态进行判别。3、为了更好判断路网交通状态,先探究车辆行程时间可靠性,行程时间分布估计是计算可靠性的基础,传统行程时间可靠性分布模型包含了:正态分布、对数正态分布、布尔分布、伽马分布等。本文除了对传统模型进行总结,还采用了混合高斯分布模型对行程时间分布进行拟合,采用EM算法对参数进行估计,对拟合优度进行检验。将混合高斯模型的概率密度函数积分,最终获得行程时间可靠性。研究结果表明,小型车行程时间分布满足混合高斯分布模型,具有较好的拟合效果。4、本文采用模糊C聚类算法对交通运行状态进行判别分析。传统的模糊C聚类在算法在初始聚类中心选取时,由系统随机产生,导致运行效率降低。本文以此展开研究,采用K均值算法对初始聚类中心进行选取,将K均值算法的聚类中心作为模糊C聚类的初始聚类中心,将改进后的聚类算法对交通状态进行判别。研究表明:改进后的算法有效提高运行效率。同时分别选取工作日和节假日中的某一天数据采用改进后的聚类算法对某路段的交通状态进行评价,发现节假日路段的拥挤程度大于工作日,且下午路段的拥挤程度高于上午。本文将“可靠性”与“交通运行状态”结合,采用畅通可靠度、基本畅通可靠度和轻度拥堵可靠度作为路段的特征参数,对路段交通状态进行判别,通过改进模糊C聚类算法,提高运行效率,为交管部门从另一个角度对路网状态进行分析提供参考价值。