基于用户生成内容的旅游知识图谱构建和信息服务研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:plutus001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
旅游信息服务,随着近年来旅游行业的快速发展,旅游信息服务面临服务内容层次薄弱、知识提取方法缺乏等问题,旅游信息服务亟需大量信息来满足用户个性化和多元化的服务需求。旅游内容平台的兴起,使得游客可以在旅游内容平台上发布大量内容,这些旅游用户生成内容涵盖了旅游活动“吃住行游娱购”多个方面的信息,能为旅游信息服务提供数据支持。但是用户生成内容包含文本、图片等非结构化数据,传统的数据库技术无法有效组织这些信息,也无法从海量信息中提取有价值的知识。知识图谱作为一种知识组织技术,能够描述真实世界中存在的各种实体和概念,以及实体之间的关系。它强调在信息的基础上,识别出信息的实体,建立实体之间的联系,从而得到知识三元组,大量的知识三元组联系在一起,便形成了一个庞大知识网络。利用机器学习、深度学习等技术可以进行知识融合和知识推理,从而不断扩充知识网络,挖掘更多实体之间的关系。基于知识,可以提供内容更丰富,服务更深入的旅游信息服务。本文在分析了现有旅游信息服务存在问题的基础上,构建了基于知识图谱的旅游信息服务框架,该框架包括数据层、知识抽取层、知识构建层、知识融合层和服务应用层五大层。整个框架实现的重点难点在于如何构建旅游UGC知识图谱以及融合旅游UGC知识图谱和其他通用知识图谱。本文首先基于旅游UGC组织的实际需求,提出一种旅游UGC知识图谱构建模型,经过数据获取、知识抽取、本体构建和关联链接四大步骤自下而上地构建旅游UGC知识图谱。然后,通过深入分析旅游UGC知识图谱和通用知识图谱的实体特点,发现融合这两类知识图谱需要同时利用实体结构信息、文本描述和属性值等多方面的特征来发现等价实体,因此本文提出一种JASE网络以实现旅游UGC知识图谱与通用知识图谱的融合,并通过对比实验证明该方法的优异性。最后,基于构建和融合好的旅游知识图谱,结合百度地图API开发了相应的基于旅游知识图谱的服务实例,突出基于知识图谱的旅游信息服务的便捷性、多元性等优点。
其他文献
聚异戊二烯橡胶是指顺式-1,4-聚异戊二烯橡胶,简称异戊橡胶(IP),又称“合成天然橡胶”,是仅次于丁苯橡胶、顺丁橡胶的世界合成橡胶第三大胶种。异戊橡胶具有很多特性与天然橡胶
铜藻(Sargassum horneri),马尾藻属(Sargassum),又名柱囊马尾藻、海柳麦(浙江)、草茜(福建)、竹茜菜(广东),富含藻胶、纤维素、半纤维素、矿物质等,因此被广泛地应用到医药、
本研究以加纳农业发展银行为研究对象,探讨激励因素及其对员工绩效的影响。进行这项研究的原因是,金融机构的员工存在工作积极性不高的问题。事实上,任何企业的成功或失败在
2004年,光大银行率先发行了第一款个人理财产品。自此,我国个人理财产品业务飞速发展。在这十几年时间里,个人理财产品从刚萌芽逐渐发展到爆发式增长。时至今日,个人理财产品
溴结构域和额外末端结构域(bromodomain and extraterminal domain,BET)家族蛋白是重要的乙酰化阅读器,家族成员包括含溴结构域蛋白(bromodomain-containing protein,BRD)2、BRD3
昆虫在长期的进化过程中形成了一套高度发达的嗅觉系统,嗅觉是昆虫与外界进行信息交流的主要方式。在嗅觉过程中,昆虫通过其嗅觉器官表面各种类型的嗅觉感器去感受环境中的挥发性物质,进而产生相应的生理或行为反应,如取食、寻找配偶、产卵、躲避天敌等。昆虫对气味分子的识别过程十分复杂,研究证实有多种蛋白参与其中,如气味结合蛋白(Odorant-binding proteins,OBPs)、化学感受蛋白(chem
补体系统由广泛存在于血清、组织液和细胞膜表面的30多种可溶性蛋白和膜结合蛋白组成,补体系统是天然免疫的重要组成部分,不仅参与炎症反应还能够提高适应性免疫应答。补体系
土壤在渍水和低pH条件下,由于氮肥的大量施用使铵态氮成为主要的氮源,而过量的铵会使植物发生毒害。本文利用收集的95份生态型拟南芥材料,采用水培试验方法,研究了2 mM NH4+
黔湘渝毗邻区是我国黑色页岩型锰矿的集中产区,近年来在该区域的找矿勘查取得重大进展,为沉积型锰矿成矿规律和成矿环境的研究提供了重要契机。黑色页岩型锰矿的形成与全球气
钾(K)是植物生长发育必不可少的三大营养元素之一,能参与调节酶活性、膜电位、细胞内稳态和蛋白质稳定合成等。已有大量的研究表明,植物从外界吸收钾离子主要是通过钾离子通