论文部分内容阅读
我国公路货运市场的承运交易信息长期处于不对称、不流通的状态,这是由其以货运代理为中间商的三方货运议价体系所决定的。在传统三方货运议价体系下,货运代理作为中间商,专门为托运方找承运人,从中收取一定的费用,由于价格不透明,导致承运人丧失了与托运人正常的议价能力,妨碍了对公路货运市场运价与运营模式的提升。同时,由于货车司机缺乏一体化的车货匹配管理和优化,缺乏合适的运价定价标准和规范,被迫低效地开展找货、配货和议价业务,造成大量的资源耗费。如今随着我国公路货运市场规模的快速增长,为了保证托运人和承运人收益的合理性,科学定量地规范传统公路货运市场运价迫在眉睫。在“智慧物流+大数据”时代来临之前,随着智慧物流相关系统的发展,Online To Offline(O2O)公路货运撮合平台提供了实时获取的海量车货匹配大数据(运单信息、成交运价、司机信息和车辆信息等)的机会,为本论文构建数据驱动的公路货运价格影响机理的研究提供了可行性。本文提出了公路货运价格异常数据的分析与处理方法,保证了用于波动分析与运价预测的数据质量;建立了一系列的波动率模型及波动预测模型,从不同层面刻画运价波动特征;建立了时滞矩阵和短时运价预测模型,探索不同运输线路运价的时间和区域相关性。具体来讲,本文的研究工作主要从以下方面展开:(1)针对O2O公路货运平台数据提出了挖掘货物运价数据异常特征分析和识别方法。从时序和概率等角度分析了公路货物运价异常数据的基本特征,从运价-吨位、运价-车长、时间-运价等散点图角度出发,提出了统计模型、四分位法和k-means聚类的组合方法用于剔除运价异常数据。该组合方法结合二次聚类,基本解决了不同运输货物类型和不同运输吨位异常数据簇聚类个数难以确定的问题。采用中国西南公路货运数据对提出的方法进行了验证,通过建模误差曲线等多个量化指标表分析表明,该异常数据组合剔除方法对于不同货物类型、不同运输吨位的异常运价数据提出效果显著,通用性和实用性较强,为公路货物运价波动分析与预测以及运价预测提供了数据基础。(2)针对公路货物运价波动率的变化特征,本文度量了区域内各运输线路运价波动的时间特征、相关统计类特征及波动的传导特征。首次对公路货物运价波动率进行定义,然后从基本统计量、Autoregressive Conditional Heteroskedasticity(ARCH)效应和平稳性等方面系统地描述公路货物运价的基本特征和波动规律,验证运价波动率序列的非线性异方差动态并基于运价波动特征建模分析其时变特征,并进一步基于Copula函数和非线性相关系数探讨了各城市运价波动率间的非线性相关性以及相互替代性。通过公路货运数据进行实例研究的结果表明,西南地区不同线路的运价波动序列在时间长度中呈现不同的变化趋势和统计特征,均不服从正态分布,具有和金融时间序列相似的尖峰厚尾特点和集群性,市场波幅具有一定的周期性。本研究序列表现出的时变异方差性表明,经典理论同方差假设不符合公路货物运价时间序列的波动特征。偏态t分布下的Generalized ARCH(GARCH)模型能较好地捕捉运价波动率序列的时变特征,当外部冲击加剧运价波动时,各运输线路呈现不同的市场表现。例如,成都到昆明货运线路的运价对市场波动敏感性最强,且其冲击作用的持续时间也较长;而重庆到昆明货运线路的运价对市场敏感性最弱,其冲击作用持续时间也较短。该方法可以有效对货运市场稳定性进行判断。再者,就各城市运价波动率相关性而言,各城市运价波动间的相关性为非线性相关,基于Gumbel Copula函数计算得到不同的非线性相关系数可知,各城市运价波动方向基本一致,但各城市运价波动之间的替代效应较小。(3)针对公路货物运价波动率杠杆效应及其预测问题,研究了运价波动杠杆效应及其影响因素,并提出了融合神经网络的滚动迭代混合异方差预测模型。首先,根据运价波动特征建模分析确认运价波动的杠杆效应,从供需、公路货运现货市场交易行为及运输货物类型等方面归纳导致运价杠杆效应的原因。同时,根据建模结果探析外界冲击(政策、油价等变动)对公路货物运价波动的冲击影响及传导特征。在此基础上,提出了融合神经网络和GARCH簇模型的混合异方差预测模型,采用实时的运价数据对预测模型进行调整和更新,采用更新后的模型对T+1时刻的公路货物运价进行预测。通过西南公路货运数据进行实例研究,结果表明西南货运市场具有明显的杠杆效应,偏态t分布的Exponential ARCH(EGARCH)模型对各运价波动序列的杠杆效应特征拟合较好:消极冲击(负冲击)对波动的影响高于积极冲击(正冲击),即在同样冲击幅度下,托运人和承运人对利空消息更加敏感,运价波动更为显著。另外,运输货物类型、油价以及宏观运输政策是导致西南货运市场杠杆效应的主要原因。在波动预测方面,案例结果表明综合考虑预测精度和预测显著性,混合异方差模型和Autoregressive Integrated Moving Average(ARIMA)模型在T+1时刻滚动迭代预测误差最小。实时数据迭代更新预测模型,能够实时反应预测环境的变化,提高模型的适应能力,保证预测的鲁棒性。滚动迭代对ARIMA预测精度影响不大,但对混合异方差模型的预测精度有显著提高。(4)针对不同货运价格间的波动传导关系,本文基于多元GARCH模型研究了区域内不同货运子市场车长的货运价格波动间的溢出效应,及运价波动的传导路径。实证研究表明发现不同货运子市场运价波动间的传递为非对称的,且各运价波动间存在强相关动态或是常态的联动关系。不同大型货车运价之间的波动传递是双向的,而大型货车对小型货车运价波动的影响是单向的。我国当前货运市场大型货车为主要省会间运力供给,小型货车主要为短途运输,因此运单需求为小型货车的部分省会间运单,该类型的运输份额也被大型货车所占据。(5)针对公路货物运价短时预测问题,本研究提出了基于各线路时间和线路间运价相关性的权重回归模型(Lagged weight matrix-based Multiple Regression Model,Lag-WMR)。该方法考虑了传统时间序列在时间维度上的依赖性,量化了现货交易市场托运人与承运人的交易行为,将其转化为区域各运价之间的相互影响力并嵌入预测模型。与传统回归模型相比,Lag-WMR模型通过机器学习挖掘影响不同运输线路运价的关键特征组合,并根据公路运价特征提出了具有实用意义的时滞权重矩阵。通过敏感性分析结果表明,单纯仅考虑线路间相关性对预测精度的提高远大于仅考虑时间相关性的模型。基于时间相关性和线路间相关性的Lag-WMR模型从预测精度和预测显著性,表现都是最优的。传统方法缺乏变量集合的解释,本文提出的建立初始特征集合,再通过机器学习筛选关键特征的方法,是对优化多元回归模型的有效补充。结合机器学习可以优化和突出对目标运价最有力的信息,避免信息冗余造成的模型过拟合,从而提高预测精度。本研究将时滞矩阵作为量化线路间相关程度的权重,保证运价的区域相关性与时间依赖性得到了有效表征,为时空相关性的预测过程提供了新的思路。