论文部分内容阅读
在社会化媒体网站上(例如Flickr网站),用户上传的带有地理标签的照片提供了大量的基于位置信息的数据。这些数据提供了丰富的有关用户行为的信息,并且随着带有地理标签的照片变得越来越普遍,这些信息的潜在利用价值也在不断增加。占据了网络信息很大部分且时刻不断增加及变换的照片和视频为多媒体、数据挖掘以及与地理学相关的研究与应用提供了新的研究机会和挑战。这些多媒体数据(例如照片)不仅含有像标签、标题以及一些表述信息;而且还含有时间信息——照片拍摄的时间,以及空间位置信息——照片拍摄地点的经纬度。近几年来,在基于简单假设——旅游景点常被频繁拍照的情况下,通过挖掘社会化媒体网站中的大量照片的信息,寻找旅游景点并为游客推荐合适景点的相关研究已经成为了研究热点。游客所提供的带有地理标签的照片集可看作是其已经访问过的景点序列。利用这些信息可为游客建立旅游历程。在近几年中,研究者已经提出各种方法寻找有意义的景点位置信息或是有代表性的旅游景点序列,进一步解决有关旅游方面的难题。另外,这些网站上提供的大量数据为研究游客在景点中的行为信息提供了一个有利条件,并且这些信息也有助于研究游客在旅游中对景点的态度、注意力以及兴趣。对要去陌生城市旅游的游客而言,制定旅行计划是最重要的。由于对旅游的城市比较陌生,游客通常需要查看旅游方面的书籍、个人旅游博客或者将网络上的一些零碎信息进行整合并制定出旅行计划。对游客而言,通过这些方式找到一些重要的旅游景点并将它们进行排序以确定旅行日程,这是非常困难的、耗时的、也是比较辛苦的。在类似Flickr网站上,用户上传的大量展示他们旅游历程的照片为我们建立旅行推荐系统提供了重要的条件,该旅行辅助系统具有如下特点:集体智慧:对刚到陌生地方而又缺乏旅游经验的游客而言,询问了解该地方的人则是一个比较好的方法。游客通过这种方法可获得更多准确而又及时的信息。但是,该方法需要游客花费时间去消化并整合所收集到的信息,进而为其旅游所用。在类似Flickr网站上,我们将用户所提供的带有地理标签的照片作为游客旅行历程的源泉,借助集体的智慧完成两个任务:(1)利用照片的地理标签对照片进行分组,汇编出一个城市的旅游景点集;(2)确定游客在不同背景下对旅游景点的使用模式。个性化:在本文中,我们假设游客有特定的旅行偏爱,他们游览一些具有相似特征的景点。通常,游客在景点拍照暗示其对该景点的喜爱。我们根据游客提供的照片及他们以往旅行历程建立游客相似性模型,得到游客特定的旅行偏爱,进一步为其进行个性化旅游推荐。情境感知:在特定的旅游景点序列中,游客对于景点的偏爱程度会受其当时所处位置、时间以及周围环境的影响。我们从含有地理标签的照片中获得拍照的时间以及拍照的地点信息,利用这些信息估计游客在不同时间段中游览景点的状况。此外,各种在线天气服务网站不仅提供了特定地理位置的当前天气状况,而且也提供该地区以往天气状况。我们将该地区当前天气状况的数据增加到该位置的当前天气背景信息中;利用该地区以往天气状况的数据过滤掉一些旅游景点,进一步为游客推荐旅游景点。本文的任务是研究基于社会化媒体的数据挖掘技术。我们从社会化媒体以及可利用网络资源中挖掘有用的信息,对旅游景点进行分析并为游客推荐合适的旅游景点。本文的主要研究内容如下:1.景点分析:在本文中,我们在分析带有地理标签的照片的基础上,提出一种简便且具有可扩展性的方法。该过程具体说明如下:(a)如何利用地理标签将用户提供的照片进行分组,找到旅游景点;(b)如何将照片提供的文本信息进行聚集并增加由网络服务提供的信息,为景点提供更多的描述信息;(c)如何对景点进行概述以及如何获得用户对景点的偏爱程度。照片中的时间标签可用作推断用户对景点的游览状况。每个景点的配置属性提供了有关用户的游览信息以及相关的背景信息。通过照片上的时间标签,我们可以确定游客游玩的时间信息,并结合在线天气信息资源进一步确定游客游玩时的天气状况。在本文中,我们阐述了如何将零碎的背景信息与稀少的照片本身内容信息以及在线信息资源结合起来的过程,进一步增加对旅游景点的描述信息。为了对旅游景点进行时空数据分析,我们建立了景点分析概念基础。我们使用该概念基础提供景点信息。当然,当地政府、服务提供商以及旅游代理也可以使用该概念基础建立以用户为中心的应用并提供基于位置信息的服务。2.重要旅游景点推荐:通过对网络上游客们提供的大量带有地理标签的照片的分析,根据游客所在陌生城市的当前背景信息,我们为游客推荐重要旅游景点。完成该任务的动机包含两部分:首先,当游客在陌生城市旅游时,该系统会为其推荐重要旅游景点;其次,该系统会根据游客当前所处的背景信息(例如:时间和天气情况),为其推荐最合适的旅游景点。在本文中,我们使用基于概率的方法选择城市中的景点以符合游客当前背景信息。“流行”、“重要”、“感兴趣”都是主观性术语,不同的人会有不同的定义。基于游客评价模型,我们定义了合理函数,例如我们将游客对特定景点游览的次数作为衡量景点重要程度的标准,为景点评分并将景点进行排序。3.个性化旅行推荐:利用带有地理标签的照片,我们提出了基于情境感知的个性化旅游景点推荐系统架构。当某游客到陌生城市旅游时,该系统根据游客的旅游偏爱以及该城市当前背景信息为其推荐若干景点。我们根据游客在一个城市的以往游览历史获得其旅游偏爱,然后利用该信息为游客在其它城市旅游时推荐景点。本文中所提方法将景点在不同背景下的流行度作为特征匹配标准,结合游客当前背景信息,为游客推荐出合适的旅游景点序列。4.个性化旅行线路推荐:当游客面对城市中的众多景点时,他需要选择合适的旅行线路并制定旅行计划以便游览该城市。照片以及照片上时间和地理信息记录了游客的旅游历程。因此,利用这些照片上的丰富信息我们可以找到游客游览的景点,并将这些旅游景点进行排序,进一步获得游客旅行景点的序列。在本文中,我们提出了一种能够从这些带有地理标签的照片中提取有意义旅行线路的方法。为游客进行旅游线路推荐时,该方法考虑了游客当前的背景信息。