论文部分内容阅读
随着汽车数量的快速增长,城市交通拥堵状况日趋严重,交通事故频发。同时,随着车联网技术的不断成熟,所产生的海量车联网数据可以被用于分析车辆行驶的潜在规律和交通热点等;分析的结果可用于指导车辆的出行以避免或减轻车辆拥堵的状况。为了挖掘出车辆行驶的潜在规律,一般的做法是对车辆轨迹数据进行聚类分析。对一些聚类算法而言,初始聚类中心的选取在很大程度上会影响最终聚类的速度及聚类效果。本文首先对各类传统聚类算法的工作原理和典型应用进行了研究,并对交通数据的特点进行了分析。根据以上地研究及分析结果,考虑选择K-means和ε-link作为基础算法对交通数据进行聚类分析。接着,为本文所提出的聚类算法做好路网及数据预处理工作,包括提取福州市的路网,对福州市的车辆位置数据进行筛选,并将符合要求的车辆位置数据匹配到相应的道路上等。接下来,针对传统的聚类算法在初始聚类中心选取时具有主观性、随机性等缺点,本文提出了一种 IRCC(Image Recognition Cluster Center)初始聚类中心选择算法,并将其应用于基于车辆位置数据的聚类中。该算法利用图像识别的方法初步定位初始聚类中心,然后再进行相关的聚类,使聚类算法能够更加快速地完成聚类。通过IRCC算法得到的城市交通热点分布情况图,可指导城市基础设施的建设和车辆出行以避免或减轻车辆拥堵的状况等。通过比较IRCC算法与随机初始点选择算法的最终结果表明,在海量车联网数据的情况下,IRCC算法的速度比随机初始点选择算法的速度快。同时,本文验证了将IRCC算法应用到福州市真实车辆数据中得到的城市交通热点分布图,能够真实反映福州市车辆聚集的情况。最后,本文进一步考虑了某一时刻车辆位置数据的聚类分析结果对分析车辆行为特征的局限性的问题,对车辆轨迹数据加以分析。本文结合IRCC算法提出了车辆轨迹聚类的方案,方案包含数据及路网的预处理工作、车辆轨迹聚类算法,并在最后验证了车辆轨迹聚类算法在福州市真实车辆数据下的聚类效果。结果表明,车辆轨迹聚类算法能够更加真实地反映车辆的行为特征。