论文部分内容阅读
网络购物已成为人们日常生活中必不可缺的一部分。网络购物中顾客和商家不需要面对面交易,这使得商家不能很好地把握消费者的想法和需求。但是顾客的购物行为的任何一个细节却服务器记录着,这使得通过分析这些行为数据来了解消费者的偏好甚至实现预测其购买行为成为可能。因此本文提出了使用大数据分析方法——机器学习算法从大量的消费者历史网购行为数据中学习出隐含在其中的购买模式获得模型,当新的顾客购物行为数据被输入到该模型中时,即可实现对顾客购买行为的预测。本文首先对网络购买行为的影响因素和预测研究进行了文献综述,深入了解网络购买行为的本质并发现目前基于大数据分析的网络购买行为研究仍处于起步阶段。所以本文以阿里巴巴举办的大数据竞赛作为研究背景,并将用户在阿里巴巴电子商务平台上真实的购物行为数据作为研究数据,通过使用机器学习算法对网络购买行为进行建模。首先使用Sql Server在原始数据的基础上构造了 322个特征,并基于Extra-trees算法提取出对于预测购买行为最有帮助的10大特征。然后本文选择了两种常用的机器学习算法:逻辑斯特回归和支持向量机,将这10个特征分别输入两个算法得到两个预测模型。最后本文基于Soft-voting的方法对以上两个算法进行融合。实验证明,融合后的模型较单一的模型具有更好的预测效果。本文的研究以数据为驱动,旨在实证说明使用消费者的历史购物行为预测其未来购买行为的可行性。本文的预测模型可以被用于购物网站的推荐系统中,实现用户界面的完全个性化,激发顾客的购买欲望,提高电子商务平台的转化率。