基于地理标注照片的景点推荐方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:atang2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网、智能手机、以及带有GPS设备的数码相机的广泛应用,人们可以随时随地拍摄一些带有地理位置信息的照片,并将它们上传到类似Flickr的照片分享网站上以与世界各地的人们分享。目前,这种由群体所贡献的带有地理位置信息的照片数量呈现出急剧增长的趋势。这些带有地理位置信息的照片为充分利用集体智慧发现热门景点、获得用户旅游偏爱、以及进一步为用户提供个性化的景点推荐服务创造了可行条件。然而,基于带有地理位置信息的照片集进行旅游景点推荐经常遭遇一些问题,例如:(1)由于旅行时间或者花费的限制,用户在旅游城市中通常只会游览少量的景点,导致了基于用户-景点矩阵的推荐系统在建模过程中出现数据稀疏性问题;(2)用户的旅行历史信息中隐含着用户在不同年份旅游偏爱的变化,通过传统的静态主题模型不能够获得用户旅行偏爱的变化。目前的基于带有地理位置信息的照片集的旅游景点推荐技术尚未十分完善,急需提出针对以上挑战的相关算法。本文利用主题模型、矩阵分解、协同张量分解、以及动态主题模型等技术,提出了四种方法以解决基于地理标注照片的景点推荐中的不同问题,为用户提供合适的旅游景点推荐服务。具体来说,本文的主要贡献如下:(1)针对旅游景点推荐中直接使用用户访问景点次数的信息不足以获得用户旅行偏爱的问题,提出了一种基于主题模型和情景感知的旅游景点推荐方法。该方法利用主题模型从用户访问景点的次数信息中挖掘用户旅行偏爱的主题概率分布,从而获得用户间的相似性信息。此外,通过照片拍摄的时间信息以及第三方天气网络服务获得用户访问景点时的天气和季节信息,结合基于用户的协同过滤方法获得景点的得分序列。该方法在推荐景点的过程中不仅能够从用户旅行历史中获得用户的旅行偏爱的主题概率分布,还能够为用户提供匹配其情景信息的旅游景点。实验结果表明,该方法优于非情景感知的推荐方法或者在情景感知情况下仅仅依靠原始用户-景点矩阵的景点推荐方法。(2)针对旅游景点推荐中仅仅使用用户旅行历史中少量的元数据信息不足以解决数据稀疏性问题,提出了基于带有联合正则项的矩阵分解的旅游景点推荐方法。通过对用户旅行历史中照片的元数据信息和照片内容信息的分析,挖掘大量用户和景点特征信息。这些信息能够从不同角度描述用户和景点,建立准确的用户和景点画像。此外,利用带有联合正则项的矩阵分解方法融合用户和景点的画像信息。这种方法可以在用户-景点矩阵分解的过程中同时限制用户和景点的潜在特征向量,准确补全原始的稀疏的用户-景点矩阵。实验结果表明,基于带有联合正则项的矩阵分解的旅游景点推荐方法能够减轻数据稀疏性问题,提高推荐的准确率。(3)针对引入时间情景信息可能导致数据稀疏性问题严重以及单个数据集很难解决旅游景点推荐中的数据稀疏性问题,提出了基于多数据集和协同张量分解的旅游景点推荐方法。通过对多个数据集的分析,从不同方面获得大量用户和景点特征信息。利用协同张量分解方法融合多个数据集的用户和景点信息。该方法能够在用户-景点-时间张量分解过程中充分使用多方面的信息辅助该张量的分解,准确地补全该张量中缺失值。实验结果表明,基于多数据集和协同张量分解的旅游景点推荐方法好于基于单一数据集解决数据稀疏性问题,能够为用户提供细粒度的旅游景点推荐服务。(4)针对传统的静态主题模型很难获得用户旅行偏爱的演化问题,提出了基于动态主题模型和矩阵分解的旅游景点推荐方法。利用动态主题模型从用户历史信息中挖掘用户和景点的隐式特征。该模型能够获得用户旅行偏爱的动态变化信息。此外,通过对多个数据集分析,挖掘用户和景点的显式特征信息。利用带有联合正则项的矩阵分解方法融合用户和景点的显式以及隐式特征信息。该方法能够同时从用户和景点两个方面限制用户-景点矩阵分解,解决用户-景点矩阵的稀疏性问题。实验结果表明,基于动态主题模型的旅游景点推荐方法相对于传统的静态主题模型而言,能够较好地获得用户细粒度的旅行偏爱信息。
其他文献
随着软件规模的不断扩大和复杂度增加,软件维护的难度也日益增大。在软件开发和维护过程中,不可避免地会产生各种各样的缺陷。软件缺陷是影响软件质量的首要因素,如果软件产
'做中学'是一种理念,是一种学习方法,更是落实数学核心素养的一个重要途径.'做中学'这种教学方法注重培养学生的学习兴趣,积累学生的学习经验,提高学生的学
目的探讨不同年龄段男性精子质量与精浆弹性硬蛋白酶和精浆中性α-葡萄糖苷酶的关系。方法回顾性分析在嘉兴市妇幼保健院门诊检测精子质量和精浆生化(精浆弹性硬蛋白酶、精浆
信息科技的突飞猛进和“互联网+”催生信息产品形态呈多样化发展,其信息服务也发生了很大的变化,探究这种发展变化是有必要的。本文运用信息和信息经济学理论与实践相结合的
目的根据健康汉族男女性血清Ⅰ型原胶原氨基端肽(procollagen type 1 N-terminal propeptide,P1NP)和Ⅰ型胶原羧基端肽交联(βcross-linked C-telopeptide of type 1 collage
乳腺癌在许多地区其发病率占女性恶性肿瘤的第一位。令人欣慰的是在过去的10年中,乳腺癌的外科手术治疗和系统化治疗方案的改进,使乳腺癌患者的病死率下降了25%,生存率明显提高。
利用调频广播、电视等外辐射源信号对目标进行无源定位和跟踪是空中目标监视与探测领域的一个重要发展方向,而确定有效的定位方法是系统实现的一个关键技术难题。叙述了基于