论文部分内容阅读
个人出行是交通系统的重要组成部分,易受到公共交通和私家车保有量和使用情况的影响。同时,控制私家保有量的增加、提高公共交通的质量与使用,是可持续交通规划战略不可或缺的一部分。然而,这一战略似乎在非洲的大多数发展中国家均无法实现,特别是加纳,其主要原因是加纳公共交通服务质量低导致了加纳私家车拥有量的增长。加纳私家车拥有量的增加引发了诸多问题。根据驾驶员车辆许可证管理局(Driver and Vehicle Licensing Authority,DVLA)数据显示,1996年至2018年间,加纳登记的车辆总数增长了700%以上,年均增长率约为10.1%,其中80%的登记车辆为私家车。导致这一增长的原因是人口的增长、生活条件的改善以及经济自由化、公共交通投资不足和城市螺旋式发展失控导致的私家车进口增加。尽管加纳人均汽车拥有量较低且集中在少数人身上,但其对城市中心的影响却不容小觑。加纳等大多数发展中国家现有的汽车拥有量模型均为聚合模型,不足以解释导致私家车拥有量增长的影响因素。尽管非集计模型较聚合模型而言更具优势,但由于私家车拥有量数据不充分,故通常采用后者。因此,本研究以大塔马利地区(Greater Tamale Area,GTA)为例,通过建立一个使用多项logit(multinomial logit,MNL)的分类选择模型,分析加纳私家车(摩托车和汽车)拥有量增长的影响因素。此外,基于模型开发过程中采用的分析技术的不同,汽车拥有量可分为统计模型和机器学习(Machine Learning,ML)模型,其中大多数汽车拥有量模型都是统计模型。然而,随着计算机和人工智能计算能力的提高,机器学习算法逐渐替代或补充了交通规划过程建模中的统计模型。尽管ML算法在诸如模式选择、交通预测和需求建模等交通规划过程中均得到了广泛的研究,但其在汽车拥有量建模中的工作却相对很少,尤其是在发展中国家的中小城市。本文采用逻辑回归(Logistic Regression,LR)、随机梯度下降分类器(Stochastic Gradient Decent Classifier,SGD)、线性支持向量分类(Linear Support Vector Classification,Linear SVC)、决策树(Decision Tree,DT)、随机森林(Random Forest,RF)、极端随机树(Extremely Randomized Trees,ERT)、adabowl、高斯朴素贝叶斯(Gaussian Naive Bayes,Gaussian NB)和K-最近邻(K-Nearest Neighbors,KNN)九种ML算法,对加纳GTA的汽车拥有量数据集进行建模。使用高效简单的数据分析工具sciket Learn和Python中的ML算法,评估每种分类算法的性能,包括准确度、精确度、召回率、ROC和Cohen-Kappa-static。此外,置换特征重要性用于确定在预测GTA汽车拥有量的重要特征。据调查,工人是最有可能拥有汽车的人群,也是最有可能推动城市汽车拥有量提高的人群。本文所用数据收集于2018年6月至8月,以平均月收入、通勤距离、非机动化基础设施的提供和社会人口因素(如年龄、婚姻状况和家庭特征)作为解释变量或特征变量。基于离散选择建模方法的研究结果表明,月平均收入、通勤距离、年龄、性别(男性)、婚姻状态(已婚),与拥有同时汽车和摩托车的可能性呈正比。工作级别高、学历高、家庭规模大、家庭子女多与拥有汽车的可能性呈正比,与拥有摩托车的可能性呈反比。居住在距离中央商务区(Central Business District,CBD)2公里范围内与拥有摩托车的可能性呈正比,提供充足的非机动车道对GTA中的汽车拥有量产生了积极影响,同时提供非机动基础设施对GTA私家车拥有量不产生影响。基于ML的研究结果表明,首先Linear SVC预测精度最好,Linear SVC、RF、ERT、Gaussian NB和KNN是基于ROC的最佳分类器,Linear SVC是Cohen-kappa静态的最佳分类器,ROC、Cohen-kappa-static和Linear SVC在预测的准确性方面是数据集的最佳分类器,在等级性能的预测方面KNN在无车辆类别时表现较好,而Linear SVC和Gaussian NB在摩托车拥有量方面表较好。对于所拥有的机动车类别,Linear SVC和LR与其他分类器相比效果更好。其次,个人出行方式的选择(汽车或摩托车)、月平均收入、平均通勤距离、月平均交通支出、通勤时间、是否为高级职员、年龄、家庭规模和婚姻状况在大多数分类工具预测汽车拥有量时具有明显的影响。然而,上述所有分类器的分析结果显示,提供非机动化基础设施、居住在距离CBD 2公里范围内以及愿意从当前交通方式转换到地铁巴士服务,在预测汽车拥有量方面的影响均不明显。最后,ML也可以应用于加纳等发展中国家的中小城市。