论文部分内容阅读
随着移动互联网的飞速发展和计算机计算能力的大幅提升,利用人工智能的方法发现旅游景点的热门旅游活动,分析游客的旅游行为,越来越成为学者们的研究重点。为了更好地识别和发现旅游活动,需要分析游客行为模式。本文基于时空情境下旅游大数据,提出了旅游活动识别和发现的算法,同时对游客时空情境下的行为进行挖掘,论文完成的主要工作如下:(1)在基于时空情境的旅游大数据的采集与分析方面,提出了基于正相关改进的卡方算法(ICAPC),在传统的卡方假设检验的基础上,添加了对类别的正负相关度的权重的区分。采用模式聚合理论进行特征抽取,考虑了特征对类别贡献程度的影响,对分类程度相似性高的项进行合并,最后采用粗糙集决策表进行特征的再次选择。对比实验表明,ICAPC算法在F1-score的表现上总体比卡方假设检验的结果要高5.26%,表明提出的ICAPC算法能使文本分类更准确。(2)在基于时空情境的旅游活动识别与发现方面,提出了基于旅游活动主题模型(TATM)的旅游活动识别与发现方法,通过游记生成的主题概率,可以将游记的旅游活动信息分类,挖掘出潜在的旅游活动主题。通过主题生成的旅游活动概率,可以发现每个景点的旅游活动分布情况,并能直观的发现每个旅游活动对应的主题。基于TATM模型在旅游活动分类结果F1-score比基于SVM的旅游活动分类高11.29%,比基于Bayes的旅游活动分类高21.32%,表明提出的基于TATM模型能有效识别和发现旅游活动。(3)提出了时序行为关联规则(ARMTBP)算法。ARMTBP算法首先对游客时序行为进行聚类,得到游客的时序行为模式集合,对游客的时序行为模式进行关联规则抽取,通过频繁项集挖掘的方法进行游客行为模式抽取。通过对比规则模式集的JM值来衡量算法性能。实验结果表明,时序行为抽取的周期最佳大小为w=6时,比w=4的时候JM值高6.92%,同时在最优JM值条件下,游客时序行为模式规则置信度也提高了 5%。实验结果表明提出的ARMTBP算法能有效地进行基于时空情境的游客行为模式挖掘。(4)设计和开发了基于时空情境的旅游活动发现与行为模式挖掘系统。实现了旅游大数据采集分析、旅游活动识别和发现、游客行为模式分析等功能。