论文部分内容阅读
近年来,随着智能手机的普及和移动互联网的飞速发展,越来越多的用户的位置信息能够被手机精确地记录和获取,这些位置信息与用户在生活中用餐、购物、娱乐等生活状态息息相关,能够准确和完整地反映用户的生活习惯和兴趣偏好。在位置数据中,手机移动数据因为其覆盖人群广泛、周期长和容易获取的特点,成为众多学者的研究。通过对手机移动信息的挖掘,掌握用户在城市中的活动情况,理解用户行为,对于用户个性化服务的提供和广告投放有着非常重要的意义。本文针对这种需求,基于Spark分布式平台设计并实现了一套用户行为推测及分析系统框架,实现了对手机位置数据的自动化清洗和轨迹还原、POI原始数据的自动获取及更新。在对轨迹进行预处理后,实现了用户活动推测功能,并在此基础上,集成了用户行为分析的功能,包括对用户的回旋半径、到访地点数目、活动时间规律、活动步长、日常移动图模式和日常活动图模式的提取和分析。在活动推测实现的过程中,本文首先综合了现有的研究,分析了目前模型中存在的缺陷,考虑POI数据不均匀以及POI在不同地区主题下对用户活动的影响度不同等因素,引入主题生成模型来建模停留点中的POI主题,通过地区内POI与主题的相关程度来确定在该主题下POI对用户活动的影响度,实现用户活动的推测,最后引入验证数据对本模型与传统模型在准确度上进行了验证对比,证明了本模型在现有模型上的性能提升。在活动推测的基础上,本文设计了一套基于用户位置数据的行为模式提取算法和分析思路,将用户在地理空间中的行为分为长期行为和短期行为,同时,结合用户的移动行为和活动行为,对用户的行为模式进行提取,实现对用户行为的全方面分析,从而帮助系统使用者理解用户的生活习惯和兴趣偏好,提供更好的个性化服务。