论文部分内容阅读
随着中国经济和航空工业的发展,越来越多的人选择飞机作为长途旅行的交通工具。航空公司作为一个企业,在销售机票时,为了使利润最大化,会采用动态定价策略来确定机票的价格。选择飞机作为交通工具的乘客希望能够在他们选择的航班的销售价格最低时购买机票。然而,机票是一种特殊的商品它具有时效性和稀缺性,机票的价格受多种因素影响,如飞机的起飞时间、提前购买的小时数和航空公司航班,所以很难让消费者知道最好的时间去买机票。本文将使用机器学习方法中的决策树算法、Q学习算法和融合模型的策略来对机票购买这一问题进行研究。试图找出最佳的机票购买时机,从而帮助消费者节省购买机票的资金。本文以上海飞往北京这一航线为例研究机票购买问题。试图通过机器学习方法为消费者找到最佳的机票购买时机,为消费者节约购买机票的资金。本文主要研究了以下三个内容:首先,在数据的获取阶段由于所需要的数据是即时的动态变化的数据,因此在数据获取阶段本文研究了如何使用网络爬虫技术获取研究所需要的数据。最终获取到10家航空公司在2018年7月28号日至2018年9月15日之间由上海飞往北京的35万条航班信息。其次,在研究购买机票的问题之前,本文通过对数据进行探索性的分析,研究了机票变化的规律以及使用机器学习方法可以节省购买机票资金的可能性。最后,通过使用决策树算法,Q学习算法以及模型融合的策略,对机票的购买决策问题进行了研究,并且从决策正确率和节约资金比例两方面评估了模型的效果。融合后的模型在决策准确率和资金节省率这两个评估标准下,相比单一使用Q学习模型和决策树模型取得了更好的效果。