按需服务平台中数据驱动的最优任务分配研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:LOVER1122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
按需服务平台,例如滴滴出行、货拉拉等,为人们的生活带来了巨大的便利。其工作流程为:首先平台客户将其需求提交到平台,平台再根据自己的需求分配策略将需求分配给相应的服务提供者,其后接收到需求的服务提供者决定是否接受该需求并进行服务。平台客户往往希望其需求被尽快接受,同时按需服务平台也希望平台中需求的应答率尽可能的高。然而,不同的服务提供者对不同需求的偏好程度不同,若服务提供者接收到了其不感兴趣的需求,平台将允许其拒绝该需求,这使得如何将需求分配给服务提供者以同时满足平台客户和按需服务平台的利益变得相当困难。此外,需求和服务提供者的分布还具有时空动态性,导致原本就困难的需求分配问题变得更具挑战性。已有的需求分配模型以数据驱动的思想解决了此类平台中的需求分配问题,其将需求一轮一轮地进行分配,并于每轮分配开始时基于历史数据预测此轮分配中服务提供者对需求的偏好,再根据该偏好进行需求分配。在该模型中,每个服务提供者在一轮分配中可以接收到一个需求,每个需求在一轮分配中被推送给多个服务提供者以增加该需求在此轮分配中被接受的可能性。然而,当平台中的服务提供者数量不足时,此需求分配方案在一轮分配并不能将所有需求推送给服务提供者,挂起的需求将等待多轮才能被推送给服务提供者,造成需求的应答时间(需求被服务提供者接受的时间)过长。为了解决这个问题,本文提出了一种多对多需求分配模型。在该模型中,每个服务提供者在一轮分配中可以接收到多个需求,同时每个需求仍然可以被推送给多个服务提供者,如此每个需求的应答时间将会有更大的可能变短。该模型首先基于历史需求应答数据中需求和服务提供者的特征,学习到服务提供者对需求应答时间的概率分布函数;随后将该学习结果输入到需求分配的最优化问题中,其优化目标为最小化需求的平均期望应答时间;最终通过解该最优化问题生成需求分配方案。在真实数据集上进行的实验表明,本文提出的多对多需求分配模型在需求应答率和需求平均应答时间上均优于已有的需求分配模型。以单轮的视角,多对多需求分配模型所产生的需求分配结果是较好的分配方案;但在多轮的角度下,由于需求和服务提供者分布的时空动态性,其分配结果可能并非最优。为了解决这个问题,本文进一步提出了基于强化学习的多对多需求分配模型。在该模型中,每个需求都被认为是一个智能体,每个智能体的动作为将自己推送给哪些服务提供者。考虑到每个智能体的动作空间较为巨大,且智能体需要彼此合作,该模型在每一轮需求分配中都通过基于状态价值函数的组合优化确定每个智能体的动作。基于真实数据集的实验表明,该基于强化学习的多对多需求分配模型在需求取消率和需求平均应答时间上均优于原多对多需求分配模型。
其他文献
影响产品质量特性的工艺参数众多,除了常规的标量型参数,具有明显函数特征的函数型参数也成为了工艺参数研究的对象。函数型参数不同于标量型参数,它对质量特性的影响是连续
上下料是生产线中的必要工序,传统生产线中主要依靠人力完成,如今工业发展到自动化、智能化的阶段,现代化生产线中,通过配置工业机器人系统实现上下料操作,但需要根据目标工
在竞争激烈的全球环境背景下,生产调度问题越来越受专家关注,其本质是目标优化的过程。混合流水车间问题(Hybrid Flowshop Problem,HFP)是一种较为常见的生产调度问题,基于石
我国是遭受风蚀灾害较为严重的国家之一,西部干旱半干旱地区尤为严重,风蚀灾害不仅严重制约社会经济发展,威胁生态环境安全,还会对人类健康造成不利影响。传统的风蚀计算与预
伴随着我国经济的高速发展,城镇化规模的不断扩大,饮食行业的繁荣使得餐厨垃圾的排放量逐年增加,并且餐厨垃圾在城市日常垃圾总量中的比例也越来越大。如果不能及时有效的处理这些餐厨垃圾将会对环境造成严重危害。餐厨垃圾是由餐桌上的剩饭剩菜组成,主要成分是面粉和大米,蔬菜,动植物油,肉类,骨头等。鉴于餐厨垃圾水分大、油脂和盐分含量高和极易腐败变质、容易被微生物分解等特性,厌氧发酵法在有效处理餐厨垃圾的同时还可
今年是中国共产党成立100周年。100年前的旧中国,帝国主义侵略横行,国家积贫积弱,社会动荡不安,人民饱受欺凌。今天的社会主义中国经济发展,政治稳定,社会进步,民族团结,人民
背景随着经济的发展,生活方式的转变,脑卒中的发病率越来越高,又因为脑卒中高致死率、高致残率的特点,脑卒中在全国和全世界都已经成为重大的公共卫生挑战。以往的研究表明传统的危险因素不能完全解释缺血性脑卒中病后死亡、残疾、心血管事件的发生。近年来的研究发现感染和血管生成可能对脑卒中的预后产生影响。我们的研究分为两部分,第一部分利用《感染因子和急性炎症标志物对急性缺血性脑卒中预后的影响(IIPAIS)》项
光学传感器是具有分子识别功能的接受器,由多种指示剂、染料、抗原和抗体核酸、组织和细胞等构成。它具有高灵敏度和非破坏性的特点,广泛用于生物传感。而随着对基因深入的研
番荔枝又称释迦果,是有名的热带水果。果肉中含有很多人体所需成分,具有很高的营养食用价值。番荔枝是番荔枝科番荔枝属最常见的植物,番荔枝科植物全世界约有120余属,其中在我国产有24属,番荔枝属植物在我国有引种栽培的为6种。主要分布于我国的云南、台湾、广西和福建等热带地区。其化学成分丰富,主要化学成分为二萜类和番荔枝内酯类化合物。随着对番荔枝的化学成分及活性研究不断地深入,发现番荔枝中不管是提取物还是
随着互联网时代的迅速发展,在线社交网络成为人们进行热点话题传播的重要渠道和载体,极大地提升了人们的生活服务与质量。如此同时,由于在线社交网络中话题参与用户关系与行