论文部分内容阅读
B2C电子商务在社会经济发展中发挥着重要的作用。由于B2C电子商务企业需要考虑上万种类商品的采购入库等环节的决策,所以其库存管理水平直接影响着企业自身的成本、盈利率和客户满意度。本文就B2C电子商务企业的库存优化问题从需求预测的角度进行了探讨。本文对B2C电商库存优化的核心—未来需求量的预测这一问题进行了深入分析。从大数据视角出发,以某真实B2C电商的运营数据为基础,进行了以商品的SKU为基本区分单位的特征工程,构建出了近70万个数据样本。然后本文进行了需求模型训练和性能分析。首先,基于全部样本数据进行了基础模型的训练和性能分析,模型包括时间序列、线性回归、决策树、随机森林、XGBoost和神经网络等,分析发现在该模式下随机森林和XGBoost模型在测试集上的预测效果最好。其次,本文考虑了商品差异性对预测能力的影响,提出根据商品业务属性和K-means聚类等方法对数据进行分类,然后针对每个子类数据训练出性能更好的模型,发现在该模式下,同样是随机森林和XGBoost模型的表现最好。最后,使用模型融合方法以充分发挥多个模型的预测能力,构建了基于数据分类和模型融合方法的Blending模型,数值分析结果证实了基于数据分类的Blending模型的性能优于单个模型或者只基于数据分类的模型。最后,从数值实验角度证明了提高需求预测精确性对库存补货优化具有显著作用。