论文部分内容阅读
随着互联网和旅游业的飞速发展,旅游信息来源丰富,分布广泛,各种类型的旅游数据分布于互联网各个空间中,游客对网上旅游信息获取的需求也越来越大。如何从大量的数据信息中准确有效的获取与旅游相关的信息变得越来越重要。本文对基于Agent的跨媒体旅游大数据感知系统进行研究,论文完成的主要工作如下:(1)结合Agent技术和信息感知的概念,针对互联网旅游信息的实际问题,建立了基于Agent的互联网旅游信息感知模型,并对模型的各个Agent模块进行了详细的设计和描述。(2)提出了基于网页链接和网页内容分析的数据感知算法(WL-CA),该算法吸取了基于链接和内容分析的优点,能有效地决定网页的爬取顺序,避免了网页抓取过程中的盲目性。提出了基于邻近法和等间隔法的动态网页更新预测算法(DWUP),能够及时地发现新的网页和及时更新变化频繁的网页,对网页更新做出精确预测,避免了对网页数据进行盲目更新。实验结果表明本文提出的WL-CA算法相比于OTIE算法和Shark-Search算法在对重要网页采集时,采集准确率有较大提高。本文提出的DWUP算法相比于邻近法和等间隔法时在预测命中率,在预测效率和预测偏移率方面分别提高了 10%,15%,8%。(3)提出了基于景区视频监控的自适应人群密度估计算法(A-CD),根据人群密度的高低自适应地选取不同的人群密度。在低密度时采用基于像素统计的人群密度估计算法,在高密度时采用基于纹理特征分析的人群密度估计算法,保证了对人群密度感知的准确性和快速性。提出了一种基于贝叶斯网络的景区视频监控盲区游客状态感知算法,可预测出景区监控盲区的人群状态,完成对景区区域内人群状态的有效感知。实验结果表明本文提出的A-CD算法相比于基于像素统计的算法和基于纹理特征分析的算法,在准确率和召回率上分别提高了 12%和14%,本文采用的贝叶斯网络对景区监控盲区的游客人群状态预测准确率达到了 80%。(4)设计开发了基于Agent的跨媒体旅游大数据感知系统。系统由四个功能模块组成,包括数据感知模块、数据存储模块、Agent管理模块、用户查询模块。该系统能基本满足对跨媒体旅游大数据感知的需求。