论文部分内容阅读
移动互联网时代,用户携带的手机随时随地记录着用户的行为活动。这些海量的移动数据带有丰富的时空信息,为分析人类行为模式和研究城市空间的前沿课题提供了新的视角和无限的可能。就国内而言,移动通信网络在我国主要的城市基本实现了百分之百的覆盖,手机用户在城市各个区域的活动都会在移动通信运营商的服务器上留下电子“足迹”,为研究用户移动模式,把握城市的脉搏,分析用户行为和城市空间的关系提供了丰富的资源。移动通信数据潜在的巨大价值日益引起各行各业的广泛关注。基于上述背景,本文以移动通信网络数据为基础,围绕研究用户移动行为和城市区域特点的关系这一主题,展开了以下研究:(1)分析了移动通信数据在人口分布特征、人口移动模式和城市功能特征三个方面的研究成果;重点总结了城市区域划分的相关论文。学习了这些研究的理论知识和主要分析方法,总结了其存在的不足和缺陷,最终形成了本文的研究思路。(2)结合本文主要使用的数据集,研究了数据清洗的方法。基于Hadoop分布式计算平台和Numpy和Pandas等数值分析包进行数据处理,完成了对数据集的预处理操作。(3)对基站流量进行时间序列建模,利用Eviews和Matlab,从流量序列的统计特征、时域特征和频域特征三个方面对基站时间序列进行特征提取,并借助机器学习工具包sklearn实现了 k-means聚类算法,实现了对基站的语义标定。(4)结合基站的语义和空间特征,利用k-means算法实现了对城市功能区的自动识别,通过MapInfo、CartoDB和Mapv等地图工具进行空间数据可视化,并验证了识别有效性。(5 )把用户轨迹映射到城市功能区之上,构建OD(Origin-Destination)矩阵,对用户轨迹的宏观语义和模式进行分析。(6)用有向图对OD网络进行抽象,借助图的连通性指标,给出了评价功能区紧密度的方法。在以上的研究中,本文深入的分析了用户的移动规律和城市区域特性的关系。研究成果对城市规划、交通监管、道路设计等具有参考价值;同时,本文在城市人口移动性方面的工作可以为人类动力学的研究提供理论研究思路,也可为基于位置的商业服务提供解决方案。