云计算环境下物流路径数据挖掘研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:chester116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业物流信息化水平不断提高,互联网的普遍运用,产生了海量的物流数据,大量的数据中隐藏着重要的信息。为了提高企业的核心竞争力,给客户提供更优质的物流服务,物流企业需要不断提高决策效率,因此如何从大量的物流数据中获取有价值的信息,辅助企业日常经营活动中的决策,成为企业面临的一个重要问题。通过对物流的路径数据进行数据挖掘分析,发现频繁移动的路径模式,从而获取关于货物流向的知识,预测货物的移动信息,找出异常的移动货物。通过频繁的路径模式,还可以深入了解物品在移动过程中的详细情况,以及这些频繁的路径隐含着的一些移动趋势信息。通过发现的频繁路径模式,可以为企业物流业务经营提供有力的决策支持,从而优化物流环节,从而降低整个物流成本。本文在系统的介绍了数据挖掘、云计算和物流路径相关理论基础上,阐述了物流路径频繁模式挖掘理论知识,并针对物流路径数据特点,采用云计算的MapReduce模型对数据挖掘的序列模式基本算法进行并行化改进,最后用改进的算法对物流路径进行挖掘分析,发现频繁路径模式。在相关研究理论的基础上,本文首先对物流路径频繁模式挖掘进行了相关研究。先阐述了物流路径频繁模式应用,接着,由于物流路径是一种序列数据,参考序列模式的相关定义,定义了物流路径频繁模式挖掘的相关概念,并采用序列模式挖掘算法中的基于Apriori思想的算法发现物流路径频繁模式。接着针对物流路径数据的特点,采用了MapReduce并行计算模型,对序列模式挖掘的基本算法AprioriAll进行改进。由于基于Apriori思想的序列模式挖掘算法对物流路径数据进行分析时,需要多次扫描数据库,并且会产生大量无用的候选序列,当数据量很大时,会占用大量的计算资源。MapReduce是云计算环境的并行计算模型,本文将序列模式挖掘的算进进行并行化改进,使之能适用于MapReduce计算模型。最后将改进的算法用于物流路径频繁模式发现,研究结果表明本文的研究思想是可行的。
其他文献
现阶段,经济全球化速度不断加快,科学技术的更新日新月异,企业竞争渐趋白热化,但山东企业大都采取OEM的制造方式,自主创新能力薄弱,产品附加值低,大都处在生产链条上的初级阶段,这在很大程度上限制了山东企业竞争力的发展。本文结合国内外的相关研究,在统计、经济、管理、系统科学等多学科理论和方法的基础上,从企业流态的全新视角,以企业流态评价指标体系为切入点,从以下四个方面就企业流态转型及自主创新能力提升展
城市化是中国经济发展与社会转型的必经阶段,也为中国的经济增长做出了巨大贡献,但在城市化过程中也产生了许多负面影响。一方面是城市空间向外围无序蔓延。为求得城市规模的扩
公共项目投资是社会发展的基础,但该领域长期存在资金短缺问题。公私合作模式引导社会资本进入公共项目领域投资,不仅可以加快公共项目的供给速度,提高供给质量;也可以不断发挥公
随着Web2.0的发展和深入,Wiki系统已在知识协同与共享中获得了广泛的应用。Wiki系统的开放性、协同性、有组织性等特性使得其形成了面向社群的、多人参与的知识协同环境。正是