论文部分内容阅读
随着互联网和信息技术的迅猛发展,互联网的信息量以指数形式增长。为了解决信息过载的问题,满足拥有不同兴趣爱好、关注领域、行为习惯、消费水平和个人成长经历的用户的信息需求,协同过滤推荐系统应运而生。但是,在互联网数据量指数增长的背景下,协同过滤推荐系统存在的数据稀疏性问题越来越严重。在高维的项目空间中,用户能够访问和打分的项目极少,这也导致了评分矩阵极度稀疏的问题。为了解决评分矩阵稀疏性的问题,本文从特征工程和推荐方法的角度出发,提出了一种基于用户行为数据以及用户与物品属性数据的混合推荐方法,并以电信运营商向用户推荐套餐为应用场景作具体论述。首先,对不同来源的特征进行有规律的特征组合,构造成组合特征。并运用word2vec方法对用户行为数据当中的时间序列数据进行特征增强,构建拥有相同消费习惯的用户之间的联系。然后,基于高效梯度提升树算法对大规模用户数据集进行建模,将高效梯度提升树模型的特征重要度以及模型输出的用户选择套餐的概率分布对套餐进行过滤,以达到对用户进行个性化套餐推荐的目的。最后,基于联通运营商发布的用户多源数据,根据构造完成的混合推荐方法,对用户的兴趣套餐进行预测并完成个性化套餐推荐。实验结果表明,基于特征组合与特征增强后的数据集可以显著提升高效梯度提升树模型预测用户匹配套餐的精度。此外,基于特征工程与高效梯度提升树模型的混合推荐方法能有效地预测到大规模用户匹配套餐的类别,且预测的精度较高,验证了基于特征工程与高效梯度提升树模型的混合推荐方法的有效性和适应性。