【摘 要】
:
为提高物流决策效率和品质,统计机器学习和数据定价分析作为新兴技术手段,能够为物流决策优化和有价值的数据共享过程带来新的视角和应用。例如,银行为冷链物流企业提供贷款业务前,购买关于冷链物流企业的数据来分析企业的经营能力,这一过程中需对交易的冷链检测信息数据进行定价。但因这类数据具有多样、数量繁多、价值不清晰等特点,通常冷链数据的价格难以有效确定。因此,本文针对冷链检测数据,提出基于Shapley值的
论文部分内容阅读
为提高物流决策效率和品质,统计机器学习和数据定价分析作为新兴技术手段,能够为物流决策优化和有价值的数据共享过程带来新的视角和应用。例如,银行为冷链物流企业提供贷款业务前,购买关于冷链物流企业的数据来分析企业的经营能力,这一过程中需对交易的冷链检测信息数据进行定价。但因这类数据具有多样、数量繁多、价值不清晰等特点,通常冷链数据的价格难以有效确定。因此,本文针对冷链检测数据,提出基于Shapley值的冷链物流检测信息特征组合定价模型,解决冷链水产品货架期预测、冷链水产品智能分拣场景中的数据特征贡献分配及动态数据的定价问题。主要工作及创新如下:(1)针对冷链数据特征的重要性问题,研究了冷链检测数据机器学习中的特征选择模型。基于交叉验证的递归特征消除思想,结合特征排列组合,并考虑预测准确度,设计冷链检测信息的特征选择方法。研究了基于Shapley值的特征贡献分配问题,将特定实例的预测结果与数据集的平均预测值之差作为该实例的特征收益,对于局部解释,通过绘制两个随机实例来模拟特征的“缺席”与否,计算特征在特定实例的边际贡献,并将绝对值的均值视为该特征在数据集中的全局贡献。(2)在冷链物流仿真模型基础上,研究了冷链检测数据的动态定价问题。构建了冷链检测数据的交易模式,定义了长期利润最大化的理想性质,利用Myerson支付函数及乘权更新思想,推导关键参数,提出了零后悔值的动态定价模型。设计的检测数据定价模型将使得对于数据提供方而言能够做到长期收益最大。并实现基于乘权更新算法的定价方案,仿真实验证明本方法的可行性。(3)将构建的模型应用于冷链实际运作场景中。对于机器学习的货架期预测模型,提出的方法能最大化的提取特征以便训练模型;对于某企业鱼类人工智能分拣案例进行分析,并与经典局部解释方法进行对比,证明基于Shapley值的特征贡献分配算法有效;此外,本文进行了数值仿真实验证明动态价格更新算法有效。
其他文献
我国是自然灾害多发的国家,灾后的应急救援车辆调度问题的研究显得尤为重要。针对强紧迫性和弱紧迫性区域下受灾点需求实时出现的情形,本文探究了考虑快速性和公平性策略的应急车辆实时路径选择问题。强紧迫性区域下快速性策略的目标函数是最小化车辆的服务完成时间及延误成本。在此基础上弱紧迫性区域增加了车辆容量限制的约束,其公平性策略的目标函数考虑到了每一个受灾点的需求量及服务时间。本文主要做了以下两方面的工作:(
中国是电子电器产品的生产和消费大国,电子废弃物环保回收处理面临着越来越严峻的形势。一方面,电子废弃物的产生量逐年增多,年均两位数的增长率。另一方面,电子产品生产者缺乏有效的策略来回收电子废弃物,实现资源最大程度的循环利用。押金返还是有助于生产者承担延伸责任的重要策略,对生产者而言,它可以将消费者的某种行为和权利相结合,比如交回旧产品与取得经济补偿或以优惠价格购买新产品相结合。但是,国内外对于生产者
随着互联网日新月异的发展,人们获取资讯的手段已发生天翻地覆的变化。网络谣言也随着消息的传播在整个社交平台上不断扩散。由于网络谣言存在突发性和短时性的特征,使其影响范围极大,并且使人们陷入恐慌的情绪中。因此,对于网络谣言传播机制的研究成为了学术界研究热点之一。针对谣言传播机理进行量化分析、对影响谣言传播的潜在因素进行挖掘,为舆情部门进行消除谣言、维护社会正常秩序提供了理论支撑。本文从谣言话题宏观多类
目标跟踪是计算机视觉领域的一个重要研究课题,广泛应用在安防监控、军事侦察、人机交互以及自动驾驶等领域。为了减少跟踪丢失的概率,提高目标跟踪的精准度,许多学者对该课题展开了深入研究,使目标跟踪在近年取得了迅速的发展。相关滤波类跟踪算法因其判别能力强和运算速率快的特点而成为了目标跟踪的重要研究方法之一。但受限于复杂跟踪环境下的干扰,相关滤波类跟踪算法在目标尺寸变化、目标遮挡、相似背景干扰以及快速运动等
社交网络平台为用户提供了方便的交流和互动工具,能够即时分享生活中产生的多种多媒体内容。同时,在通信网络和硬件设备不断的发展前提下,社交网络平台也变得越来越庞大。然而,社交网络平台上的大量用户及发布内容的便捷条件吸引了大批网络垃圾用户。虽然国内外研究者提出了许多用于检测垃圾信息及垃圾用户的方法,但是仍存在许多问题,例如建立词库的巨大工作量、基于词的语言特征失效、检测精度及检测效率较低等。为了解决以上
成像器件的动态范围(Dynamic Range)代表了它对场景中的亮暗目标的采集能力,同时受限于硬件条件与制造成本,单次成像能够记录的动态范围远小于人类眼睛,使得照片的观感不尽人意。因此,基于软件的动态范围拓展技术被提出在不显著增加硬件成本的基础上大幅度提升成像质量。如果有效采集场景中的动态信息并将其尽可能多地展示在动态范围受限的显示器上则成为了本领域的研究重点。在过去的数年间有大量相关方法被提出
相似轨迹查询为用户提供了一种有效管理轨迹数据的方法,使得用户可以指定查询区域得到经过该区域的轨迹数据。目前的相似轨迹查询方法往往基于采样位置和采样事件等信息。而在突发社会事件下,用户出行信息往往以文本的形式记录下来。文本不能直接应用于相似轨迹查询,但蕴含了丰富的用户出行位置信息。另一方面,随着互联网的发展,出现了既具有用户出行位置信息,又记录了用户在特定位置进行特定活动的语义轨迹数据。目前许多研究
磁共振成像(Magnetic Resonance Imaging,MRI)技术可以获取到反映人体器官组织多种信息的多模态医学图像,例如:T1加权、T2加权和FLAIR图像等,这些多模态MRI图像被广泛的应用到疾病诊断和临床治疗中。但是,成像原理的限制导致了获取多模态MRI图像需要昂贵的时间成本和经济成本,因此,从已有的MRI图像来准确预测出所需的MRI图像,例如,从已有T1加权图像预测缺失的T2加
近年来,在高压生活以及不规律生活习惯的作用下,心血管疾病致死率高居世界疾病致死榜首,给人类生命健康带来了巨大灾难。心电信号(Electrocardiogram,ECG)作为反映心脏运行状况的体外表征,常常作为心血管疾病诊断的重要依据。随着医疗科技的发展,心电自动诊断系统开始进入公众视野。然而,由于其诊断准确性和实时性不足,心电自动诊断系统却迟迟未得到大规模应用。本文旨在对心电信号分析算法进行研究,
机器阅读理解作为自然语言处理领域的热门研究课题之一,意义在于使机器理解文本语义并具备推理、提炼文本信息并回答相关问题的能力。得益于不断发展的深度学习技术以及大规模机器阅读理解数据集的发布,大量优秀的模型不断被提出和改进,从而推动着机器阅读理解技术的发展和进步。然而现有的大部分机器阅读理解模型仍然具有以下问题:传统的词向量生成技术不能很好地捕获语义信息、效率较低;BiLSTM技术对文章和问题进行编码