论文部分内容阅读
居民出行行为分析是进行城市综合交通体系规划和城市建设规划十分重要的基础工作,同时也是制定交通政策的有效依据。传统的居民出行数据采集主要靠入户访谈及问卷调查,有着误报率高、费时费力等缺点,已不能满足现代社会的需要。随着地理信息系统(GIS)技术的飞速发展和全球定位系统(GPS)的广泛部署,大量个体的移动轨迹数据被广泛的存储起来,为居民出行行为分析提供了新的思路。论文以西安市12000辆出租车一个月的真实GPS数据集为基础,研究如何从出租车轨迹数据提取出行特征,并将其应用于居民出行行为分析、热门区域发现、区域功能识别等内容。论文的主要工作如下:(1)利用基于云计算的MapReduce并行计算框架对原始GPS数据集进行二次排序和轨迹提取,完成了数据清洗及地图匹配的工作。(2)从GPS数据中提取居民出行的OD信息,设计分时段的平均出行次数、平均出行时长、平均出行距离等多种出行特征,对比分析西安市居民节假日和工作日出行不同的时间规律,并用可视化的方法分析居民出行在空间上的分布情况。(3)提出一种改进的DBSCAN算法的居民出行热门区域发现算法,改善了传统DBSCAN算法对参数敏感,聚类范围无限制的缺点。该算法根据簇的动态近邻密度自适应的选择参数,给定热门区域的面积约束,并对超过面积约束的簇进行分裂,将数量众多的OD点聚类成大小合理的热门区域。(4)提取不同维度的热门区域的人流时序特征,描述区域的人流变化规律与不同区域的社会功能之间的关系。提出了一种结合不确定抽样的半监督分类算法,将之应用于热门区域的社会功能识别上,最终成功将热门区域分为车站、景区、商业区、居民区、学校、娱乐区六大类。实验结果证明,出租车轨迹数据能较好的反映城市居民出行的时空分布规律。改进的DBSCAN算法能聚类出合理面积的居民出行热门区域,避免了传统算法聚类结果面积不受约束的缺点。热门区域的人流特征可以来识别区域的社会功能,且细颗粒的人流时序特征分类效果更好。结合不确定抽样的半监督分类算法只需要对少量的区域进行标注,即可获得较高的分类精度。