论文部分内容阅读
移动应用(Mobile Application, APP)市场采用推荐技术将APP推荐给不同的用户,以此帮助用户从海量的APP中发现感兴趣的内容。但是由于APP所处领域的限制,APP推荐存在一系列的问题,例如APP使用分布容易出现重头和长尾现象、数据稀疏问题、冷启动问题等。其中,重头和长尾现象的出现不利于APP领域的发展,数据稀疏问题则限制了推荐算法的效率,而且随着APP数量的增长,这些问题将日益突出。Netflix竞赛的出现在很大程度上推动了推荐领域的发展,但是APP推荐算法研究还不成熟。目前移动应用市场APP推荐算法主要集中在关联推荐、热门推荐以及新品推荐等,这些传统的推荐方法没有从根本上解决APP推荐面临的问题。随着APP市场的日益完善,APP市场将拥有更加完备的APP信息以及用户信息,如何利用这些信息帮助解决APP推荐面临的一系列问题变得十分重要。针对APP数据集特点,本文提出将排序方法、聚类技术与推荐算法相结合,共同挖掘APP多维度文本数据中蕴藏的关系信息,在此基础上开展基于异构信息网络聚类的APP推荐算法研究。第一,构造多维度文本组成的APP信息网络模型,包括用户、APP、描述文本、发布者信息以及分类信息等。第二,通过两种排序算法获取附属类型对象的排序分布。第三,在排序分布的基础上建立一个针对中心类型的混合概率生成模型,使用EM算法估计参数的最优值,然后依据贝叶斯理论获得对象的后验概率,根据对象的聚类分布重新划分类簇。第四,根据APP以及用户聚类结果开展两种不同的协同过滤算法,即基于伪评分的IBCF (Iterm-Based Collaborative Filtering)算法以及基于时间衰退的UBCF(User-Based Collaborative Filtering)算法。本文采用360手机助手应用市场中的数据集进行实验分析,实验结果表明本文提出的APP推荐算法能够增强APP推荐的实际效果。