基于无核二次曲面SVR与网格密度聚类的即时配送服务顾客需求分层预测

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:zhangqi1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的快速兴起,O2O这类电子商务模式不断发展,伴随着智能手机的普及渗透到人们工作生活的各个领域。应运而生的即时配送服务领域也随之不断发展壮大。比如O2O外卖平台初期通过烧钱补贴,粗犷发展,获得客观的用户数量,其市场的蛋糕也在不断扩大。不过随着用户增多,平台的运营和即时配送服务的资源调配也随即紧张起来。因此,面对源源不断的用户订单数据,为了提高平台的支撑能力,根据已有的大量历史数据预测未来的消费者行为是业内常见的做法。通过精准的预测,能更有针对性的对不同需求的客户提供更精准的服务,提升消费者的满意度和服务质量。也能够合理分配即时配送服务的资源,提高平台的运营能力。因此,本文从这一角度出发,利用平台积累的历史数据,挖掘即时配送服务订单地理区域的特征规律,尝试将订单地理区域依照客户的地址分布情况划分成不同的子区域。在不同子区域的内部划分不同顾客层次(如高端,中端,低端)。将客户层次精细化。进而从订单的总地理区域层级,子区域层级,以及客户层级三个方面进行需求预测。并利用分层预测算法协调预测结果,提升预测的准确性和鲁棒性。从而细致化的提升平台对每个子区域的服务。还能够针对不同层次客户需求充分挖掘平台的调度能力,降低运营成本。本文主要基于某平台的外卖订单数据,研究即时配送服务订单地理区域的划分问题以及不同层次客户的需求预测问题。从以上几个问题出发,本文具体工作内容和结论如下:(1)通过对历史数据的挖掘和定量分析,将整个订单地理区域划分成相同大小的网格状区域,并将订单的实际位置映射到相应的网格内。值得注意的是,网格大小的划分会影响后续的实验,因此在网格大小的评判方面,本文利用订单相关信息构造基础特征,根据无核二次曲面支持向量回归(SQSSVR)对网格区域的订单均价进行拟合。根据拟合的结果评估网格的大小情况,以此作为网格调整的基础。(2)在确定的网格划分基础上。采用数据挖掘的方式,提取网格订单数量等信息。对网格化的订单地理区域进行了研究,通过对网格进行密度聚类,将即时配送服务订单地理区域进行区域聚类划分,形成多个子区域。在此基础上借鉴RFMD模型结合模糊C-均值算法对每个子区域实现客户层次(高端,中端,低端)的聚类和划分。(3)由以上的聚类,可以获得三个层级的数据。分别是总区域的订单数据,子区域订单数据,以及各子区域下的不同层次客户数据。根据描述性统计构建相关的特征维度。为了预测未来一段时间的需求,将特征输入至SQSSVR模型获得不同层级的预测结果。同时,也选取线性回归,支持向量回归,神经网络,以及目前主流的集成学习方法Xgboost进行对比实验。(4)在SQSSVR的预测基础上,考虑由于不同层次客户这一级别的数据噪声较大且预测不稳定,选择基于历史比例的自上而下的分层预测算法对已预测的不同层次客户需求进行协调处理,从而提高预测的整体精度及稳定性。本文的主要结论:(1)基于历史数据,根据SQSSVR拟合情况确定即时配送服务订单地理区域的网格大小,获得网格的特征和规律,建立并解释顾客层次与其需求所处区域的关系,实验证明,网格区域的订单均价与网格所处经纬度,纬度,用户数,以及优惠力度存在相关性。(2)通过基于日均订单数的网格密度聚类算法。在调整Eps和MinPts参数的基础上,能够将整个订单地理区域聚类划分为几个子区域。不仅在地理上按照客户的真实订单划分,也打破了以往通过行政区域划分的局限性。(3)即时配送服务需求预测方面,鉴于SQSSVR的非线性以及鲁棒性较好的特点,本文选择SQSSVR对未来一段时间的需求进行预测。同时对比多元线性回归,支持向量回归,神经网络,集成学习算法Xgboost。通过实验证明SQSSVR确实在预测即时配送需求方面有着不错的表现。除此之外,从不同层级的角度看,针对整个即时配送订单地理区域SQSSVR预测效果普遍较高且稳定,而随层级下移,尤其是客户层级方面,本文所选用的模型都存在预测不稳定的情况。说明底层数据的噪声加大,影响了预测结果。(4)在不同层次客户需求的预测方面。由于最底层——不同顾客需求数据的波动加大,导致所选择的机器学习方法的预测结果失真。参考意义减弱。因此,选择通过基于历史平均的自上而下的分层预测算法对底层预测结果修正。实验证明分层算法能够在一定程度上提升预测效果。提高整体底部预测的准确率。并且在保证不同层次上顾客需求预测值完整性的同时也协调提高它们的预测质量。
其他文献
学位
学位
学位
大数据,物联网和人工智能等尖端技术为智慧图书馆的发展注入了新的活力。智能设备是新技术的载体,智能设备让抽象的技术变得形象和实用。读者和图书馆员正是通过智能设备的应用对尖端技术有了感知。图书馆智能设备的购买和应用应该是组织群决策和理性的个人行为的结果,其目的是提高图书馆的服务质量和工作效率,实现效益的最大化。但目前的现实情况却与理想相违背。信息技术采纳领域大量的研究表明,企业投资大量的资源进入新信息
学位
学位
觉罗塔格构造带内发育有大量石炭纪火山岩,其分布主要受康古尔塔格和阿奇克库都克断裂控制。近几年在觉罗塔格构造带内通过化探手段发现了阿奇山铅锌矿,该矿区面积约为6.75km~2,铅锌储量共197万吨(铅:37万吨;锌:160万吨),锌平均品位为0.85%,铅的平均品位为0.2%,属大型铅锌矿。矿区出露地层主要为雅满苏组第四岩性段,其年龄为334.2±2.5 Ma,地层呈NE-SW走向。矿体在地层中顺层
天山准格尔铀成矿省是我国五大铀成矿省之一,近几年来,相较于其他类型的铀矿床,关于砂岩型铀矿的勘察进展明显。盆地在形成演化过程中的流体动力学及其铀矿化是能源矿产的基础依据,因此也备受关注。萨瓦甫齐砂岩型铀矿床所处的萨瓦甫齐盆地,位于塔里木盆地的北缘,西天山的南部,正处于准噶尔-天山的铀成矿省中。矿床的铀矿化以砂岩型为主,主要产铀层位为中下侏罗统克拉苏群铁米尔苏组的Ⅱ-4、Ⅱ-5铀矿化层,铀成矿作用严
近十年来定向增发深受上市公司的欢迎,其发行成本低、发行对象少、融资规模大,成为我国上市公司的主要再融资方式。但是定向增发过程中大股东侵害小股东利益的问题时有发生,国内外学者针对定向增发中的利益输送进行了大量研究,从研究对象上看,主要针对财务型定向增发进行研究,从研究内容上看,主要研究定向增发的利益输送方式。而近年来,资产收购型定向增发在中国资本市场不断增长,而针对这类定增的研究却较少,是否在资产收
在产品市场中存在众多消费者,其购买行为受品味、收入、年龄等多因素影响,进而产生很大的差异性。越来越多的企业深刻认识到,企业所提供的单一产品或服务已经无法满足消费者个性化、多样化需求。日常销售中,企业通常利用产品线向消费者提供差异化、个性化的产品或服务。扩张产品线能够满足消费者不同购物选择,提升了企业市场份额;但相应地增加了企业经营管理难度,扩张了产品线成本。合理的产品线设计,不仅使得企业满足多样化