基于订票行为的航空旅客划分方法研究

来源 :江苏科技大学 | 被引量 : 17次 | 上传用户:icenum123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着国内经济的高速发展,民航旅客的数量急剧增加,国内民航进入快速发展模式。各航空公司为了应对民航市场的激烈竞争,分析民航不同旅客群体的出行偏好,进而制定相应的竞争策略成为航空公司的迫切需求。为此,本文以航空旅客购票时记录的客户信息作为数据来源,采用聚类分析的方式,在对客户群体进行有效划分的基础上,分析航空旅客的出行偏好。与传统聚类算法分析的数值类型的数据不同,本文以记录航空客户订票行为的数据作为分析对象,其特殊性在于:首先,源数据为包含数值属性和分类属性的混合类型数据;其次,数据量庞大且分布存储于各航空公司。为此,本文通过改进现有聚类算法的方式使其适合于单一航空公司混合类型数据的聚类分析,从局部的角度分析单一航空公司的旅客出行偏好;进而设计分布式聚类算法,以同时利用不同航空的旅客信息,从全局的角度来分析民航旅客的出行偏好。因此,本文的研究工作主要包括以下两个方面:(1)本文以旅客订票过程中记录的相关信息为基础,将旅客群体划分归结为混合类型数据的聚类问题,采用k-prototypes算法来实现航空旅客群体的有效划分。同时,针对描述旅客购票信息的部分数据属性为离散值且类别众多、语义模糊的不足,借助于民航领域知识对属性数据进行转换表示,简化了属性数据的类别信息,显示表示属性数据中的隐含知识;同时通过构建旅客价值的定量计算模型,有效刻画旅客价值,从而在对航空旅客进行有效划分的基础上分析航空旅客的出行偏好。(2)为了有效处理大规模分布式混合数据集,本文通过扩展k-prototypes算法,以并行方式运行k-prototypes算法,结合领域知识,提出了面向领域的并行k-prototypes算法(Domain based Parallel K-prototypes,DPKP),使得各自航空公司的旅客划分和数据分析在各自站点完成,在提高算法运行效率的同时保护了航空公司的商业隐私。实验结果表明,本文提出的聚类算法适合对航空旅客数据的划分,不仅使得聚类结果的准确性有所提高,而且聚类的时间效率也有提升。最后本文利用国内航空公司提供的旅客数据集,结合本文提出的聚类算法,构建航空旅客细分模型,对旅客进行细分,同时根据细分结果分析不同旅客群体的出行需求,制定相应的营销策略,从而为航空公司提供了很好的战略建议。
其他文献
视频质量评估的研究是图像信息工程的基础技术之一。在视频通信应用中的视频传输技术,视频处理中的编码压缩技术和视频恢复技术,所有这些技术不论优劣都会在一定程度上影响到
被动测量由于对网络运行无干扰,测量数据能真实地反映网络行为,所以被广泛应用于网络测量工作和网络行为学研究。本论文的研究工作基于CERNET华东(北)地区网络中心,为了支持网络
随着计算机的发展与应用,人与计算机的交互越来越密切,人机交互技术随之应运而生并极大的改变着人们的工作和生活方式。手势交互作为人机交互技术中重要的一环也越发引起科学
访问控制技术作为支撑信息系统安全的重要技术之一,广泛应用于操作系统、数据库以及各种应用系统的安全防护之中。随着计算机网络、分布式等技术的发展,尤其是Web服务技术的
视频监控技术是计算机视觉领域一个新兴的应用方向和备受关注的前沿课题,是计算机科学、机器视觉、图像工程、模式识别和人工智能等多种学科的结晶,广泛应用于城市道路交通监
1985年Miller和Koblitz分别独立提出椭圆曲线密码体制(ECC, Elliptic Curve Cryptosystem) ,由于ECC本身计算速度快,存储空间小,带宽要求低,特别适用于Smart卡和无线应用环境
网格是继因特网之后又一次重大的科技进步,它来源于人们熟悉的电力网,代表了一种先进的技术和基础设施。网格的目标是将地理上分布、异构的高性能计算机、数据服务器、大型检
互联网不断地深入到人们生活的方方面面,如何对互联网上的非法网页进行过滤,给用户营造一个良好的学习和工作环境,成为一个重要的研究领域。由于当前的网页过滤系统对网页过
目标跟踪是典型的动态系统状态估计问题。线性、高斯条件下,卡尔曼滤波是最优估计。但实际应用中,运动目标极少满足单一模型和线性、高斯条件。在强非线性、非高斯环境下,卡
隐蔽通道是信息隐藏(Message Hiding)的一个重要分支,它是允许进程间以危害系统安全策略的方式传输信息的通信信道,网络隐蔽通道作为隐蔽通道中的一种,黑客常常会利用它来窃