论文部分内容阅读
随着移动终端的普及、无线定位技术的进步及移动互联网的发展,移动定位社交服务(Location Based Social Networking Service,LBSNS)作为一种全新的社交网络服务形式迅速产生并广泛应用于人们的日常生活。Foursquare、Loopt等的成功既是对这种新型社交网络服务的认可,也显示出巨大的潜在市场价值。在LBSNS迅速发展的同时,也面临着巨大的挑战,其中智能化和个性化推荐准确性问题是LBSNS的核心问题之一,得到国内外研究学者广泛的关注。虽然现在已有不少与之相关的研究,但停留点提取准确性低和数据稀疏与冷启动下推荐效果不高一直没有得到有效的解决。针对以上问题,本文提出基于用户与主题聚类推荐(Graph-Theme and User Clustering Recommendation,GTUCR)算法,主要内容有:首先,提出停留点数据模型(StayPointModel,SPM)。针对移动数据的特点,提出一种基于原始GPS点到停留点的建模方法。在该方法中,不但考虑到时间和距离因素,同时也加入平均速度、停留率和速度改变率等限制条件,使得停留点提取准确性升高。其次,停留点预处理。将与人们息息相关的场所划分成不同主题类型,通过搜索引擎提供的API接口获得停留区域内各主题场所的数量,将用户所有停留点中主题场所数量规范化为用户兴趣向量,并通过兴趣向量提取出核心用户。第三,核心用户图摘要聚类。将节点分为用户和主题,根据用户与主题之间的关系对核心用户进行图摘要迭代聚类,形成满足模糊性和差异性的核心用户聚类。将普通用户加入到核心用户聚类中,根据全用户聚类特征向量之间存在的关联关系为用户产生个性化推荐向量。最后,通过真实用户历史位置数据集进行实验,选取出停留点各个最优参数;对本文提出基于用户与主题聚类推荐算法与K近邻协同过滤方法进行比较,GTUCR算法在数据稀疏和冷启动情况下有较高的推荐准确性和多样性。