基于地理标签的社会媒体数据挖掘的智能旅游推荐研究

被引量 : 0次 | 上传用户:vierilv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社会化媒体网站上(例如Flickr网站),用户上传的带有地理标签的照片提供了大量的基于位置信息的数据。这些数据提供了丰富的有关用户行为的信息,并且随着带有地理标签的照片变得越来越普遍,这些信息的潜在利用价值也在不断增加。占据了网络信息很大部分且时刻不断增加及变换的照片和视频为多媒体、数据挖掘以及与地理学相关的研究与应用提供了新的研究机会和挑战。这些多媒体数据(例如照片)不仅含有像标签、标题以及一些表述信息;而且还含有时间信息——照片拍摄的时间,以及空间位置信息——照片拍摄地点的经纬度。近几年来,在基于简单假设——旅游景点常被频繁拍照的情况下,通过挖掘社会化媒体网站中的大量照片的信息,寻找旅游景点并为游客推荐合适景点的相关研究已经成为了研究热点。游客所提供的带有地理标签的照片集可看作是其已经访问过的景点序列。利用这些信息可为游客建立旅游历程。在近几年中,研究者已经提出各种方法寻找有意义的景点位置信息或是有代表性的旅游景点序列,进一步解决有关旅游方面的难题。另外,这些网站上提供的大量数据为研究游客在景点中的行为信息提供了一个有利条件,并且这些信息也有助于研究游客在旅游中对景点的态度、注意力以及兴趣。对要去陌生城市旅游的游客而言,制定旅行计划是最重要的。由于对旅游的城市比较陌生,游客通常需要查看旅游方面的书籍、个人旅游博客或者将网络上的一些零碎信息进行整合并制定出旅行计划。对游客而言,通过这些方式找到一些重要的旅游景点并将它们进行排序以确定旅行日程,这是非常困难的、耗时的、也是比较辛苦的。在类似Flickr网站上,用户上传的大量展示他们旅游历程的照片为我们建立旅行推荐系统提供了重要的条件,该旅行辅助系统具有如下特点:集体智慧:对刚到陌生地方而又缺乏旅游经验的游客而言,询问了解该地方的人则是一个比较好的方法。游客通过这种方法可获得更多准确而又及时的信息。但是,该方法需要游客花费时间去消化并整合所收集到的信息,进而为其旅游所用。在类似Flickr网站上,我们将用户所提供的带有地理标签的照片作为游客旅行历程的源泉,借助集体的智慧完成两个任务:(1)利用照片的地理标签对照片进行分组,汇编出一个城市的旅游景点集;(2)确定游客在不同背景下对旅游景点的使用模式。个性化:在本文中,我们假设游客有特定的旅行偏爱,他们游览一些具有相似特征的景点。通常,游客在景点拍照暗示其对该景点的喜爱。我们根据游客提供的照片及他们以往旅行历程建立游客相似性模型,得到游客特定的旅行偏爱,进一步为其进行个性化旅游推荐。情境感知:在特定的旅游景点序列中,游客对于景点的偏爱程度会受其当时所处位置、时间以及周围环境的影响。我们从含有地理标签的照片中获得拍照的时间以及拍照的地点信息,利用这些信息估计游客在不同时间段中游览景点的状况。此外,各种在线天气服务网站不仅提供了特定地理位置的当前天气状况,而且也提供该地区以往天气状况。我们将该地区当前天气状况的数据增加到该位置的当前天气背景信息中;利用该地区以往天气状况的数据过滤掉一些旅游景点,进一步为游客推荐旅游景点。本文的任务是研究基于社会化媒体的数据挖掘技术。我们从社会化媒体以及可利用网络资源中挖掘有用的信息,对旅游景点进行分析并为游客推荐合适的旅游景点。本文的主要研究内容如下:1.景点分析:在本文中,我们在分析带有地理标签的照片的基础上,提出一种简便且具有可扩展性的方法。该过程具体说明如下:(a)如何利用地理标签将用户提供的照片进行分组,找到旅游景点;(b)如何将照片提供的文本信息进行聚集并增加由网络服务提供的信息,为景点提供更多的描述信息;(c)如何对景点进行概述以及如何获得用户对景点的偏爱程度。照片中的时间标签可用作推断用户对景点的游览状况。每个景点的配置属性提供了有关用户的游览信息以及相关的背景信息。通过照片上的时间标签,我们可以确定游客游玩的时间信息,并结合在线天气信息资源进一步确定游客游玩时的天气状况。在本文中,我们阐述了如何将零碎的背景信息与稀少的照片本身内容信息以及在线信息资源结合起来的过程,进一步增加对旅游景点的描述信息。为了对旅游景点进行时空数据分析,我们建立了景点分析概念基础。我们使用该概念基础提供景点信息。当然,当地政府、服务提供商以及旅游代理也可以使用该概念基础建立以用户为中心的应用并提供基于位置信息的服务。2.重要旅游景点推荐:通过对网络上游客们提供的大量带有地理标签的照片的分析,根据游客所在陌生城市的当前背景信息,我们为游客推荐重要旅游景点。完成该任务的动机包含两部分:首先,当游客在陌生城市旅游时,该系统会为其推荐重要旅游景点;其次,该系统会根据游客当前所处的背景信息(例如:时间和天气情况),为其推荐最合适的旅游景点。在本文中,我们使用基于概率的方法选择城市中的景点以符合游客当前背景信息。“流行”、“重要”、“感兴趣”都是主观性术语,不同的人会有不同的定义。基于游客评价模型,我们定义了合理函数,例如我们将游客对特定景点游览的次数作为衡量景点重要程度的标准,为景点评分并将景点进行排序。3.个性化旅行推荐:利用带有地理标签的照片,我们提出了基于情境感知的个性化旅游景点推荐系统架构。当某游客到陌生城市旅游时,该系统根据游客的旅游偏爱以及该城市当前背景信息为其推荐若干景点。我们根据游客在一个城市的以往游览历史获得其旅游偏爱,然后利用该信息为游客在其它城市旅游时推荐景点。本文中所提方法将景点在不同背景下的流行度作为特征匹配标准,结合游客当前背景信息,为游客推荐出合适的旅游景点序列。4.个性化旅行线路推荐:当游客面对城市中的众多景点时,他需要选择合适的旅行线路并制定旅行计划以便游览该城市。照片以及照片上时间和地理信息记录了游客的旅游历程。因此,利用这些照片上的丰富信息我们可以找到游客游览的景点,并将这些旅游景点进行排序,进一步获得游客旅行景点的序列。在本文中,我们提出了一种能够从这些带有地理标签的照片中提取有意义旅行线路的方法。为游客进行旅游线路推荐时,该方法考虑了游客当前的背景信息。
其他文献
<正>学校组织青年教师研读苏派教学《著名特级教师教学思想录》,倪晨瑾老师给我留下了深刻的印象,特别是她在所拟的标题中提及了"儿童"。一般在我们的教育话语中更多的是使用
现阶段我国建筑领域的发展比较迅速,建筑企业间的竞争比较激烈,为了能在市场竞争中获得优势发展地位,建筑设计过程中要充分重视新材料新技术的应用,这是提高自身竞争力的重要
[目的]探讨妇科器械有效的预处理方法,提高清洗效果。[方法]将妇科小手术使用后的器械分为3组分别进行预处理,A组擦掉器械上肉眼可见的污物后直接清洗;B组采用自来水加多酶清
随着世界经济全球化趋势的加强,跨国公司已成为国际活动中的重要经济力量之一,深刻影响着世界经济、政治和社会生活。同时,跨国公司也在不断调整自己的发展战略和子公司战略角色
投资者适当性作为海外成熟资本市场普遍存在的重要监管规则,通过调整证券金融机构的金融产品销售行为,保护投资者的利益。适当性源于上世纪美国的自律组织规范,现已发展为监
词的联想意义是指一个词明确指称或描写的事物之外的暗示意义。它不同于词的字面意义。受诸多因素的影响,很多词在不同的语言背景下指相同的事物,但却具备不同的联想意义,能
数字技术的蓬勃发展对人类社会的各个方面都产生了深刻的影响,随着数字技术的飞速发展和日益普及,数字出版这一崭新的信息传播方式也应运而生。数字出版是数字技术和出版的密切
本文在认知语言学框架内,以原型理论、隐喻和转喻为理论基础,以英汉语言中的颜色词"红"为例,比较分析英汉两种语言中颜色词认知语义结构的共性和个性并简要分析其原因。
目的探讨细胞周期素依赖蛋白激酶5(CDK5)介导的过氧化物酶体增殖物激活受体γ(PPARγ)磷酸化在动脉粥样硬化中的作用。方法常规培养小鼠Raw264.7巨噬细胞,实验设对照组(C组)
<正>蜂巢迷宫(如图1)是"最强大脑(第二季)"中其中一个挑战项目,这个迷宫,由127个正六边形组成,迷宫内包含完全相同的420扇木门,840个把手(每扇木门有正反两个把手),它有一条