论文部分内容阅读
随着科技和文化的发展,服装已不再是过去保暖的工具,它更是展现自我的方式。如今面对海量的服装数据,传统的服装推荐虽能达到良好的推荐效果,但由于过分依赖用户历史行为数据而经常出现冷启动和数据稀疏问题,同时因为忽略上下文环境,导致推荐结果达不到用户特定场景下的需求。因此,对服装个性化推荐的研究变得十分有意义。
知识图谱的本质是语义网络,它揭示了世间万物之间的关系。而服装本身自带了诸多属性和知识,但目前知识图谱的研究多数在通用领域,专业领域尤其是服装领域仍处于起步阶段,因此基于服装知识的知识图谱研究具有一定的意义。
智能问答作为知识图谱应用的延伸,它以用户输入的自然语言为基础,通过对语句的理解和知识检索返回给用户相关内容的答案,减少了用户的搜索成本、缩短了用户获取答案的时间,一定程度上弥补了信息检索的不足。目前,许多智能问答平台都将知识图谱与其结合,都有不错的效果。
结合上述,本文研究并实现了一种基于知识图谱的服装推荐和智能问答系统。该系统在用户提交实时服装需求后,利用构建好的服装知识图谱进行推荐,当获取到用户历史数据后,再利用已构建好的知识图谱找到与该服装相似的其他服装产生进一步推荐。同时为了提高交互性和充分利用知识图谱,文本采用智能问答的形式对服装问句进行答案推荐。
本文主要工作如下:
1.通过对用户、服装以及影响服装推荐的情境信息进行分析与整理,明确了服装推荐涉及到的实体、属性、实例等,利用构造本体的方法来定义服装推荐知识图谱的Schema。通过处理及整合获取的服装信息数据源,利用信息抽取对半结构化数据进行知识抽取,并采用基于属性向量的实体对齐方法进行知识融合,利用Apriori算法得到服装与服装、服装与环境之间的关联关系并将其整理为推理规则。最后,本文利用Protégé进行了知识图谱OWL表示和数据生成。
2.提出了基于知识图谱的服装推荐方法。当用户提出需求时,系统通过收集需求信息和调用API接口得到的实时动态情境信息,利用构建好的知识图谱,采用SPARQL查询语句和Jena推理机进行检索并产生初次推荐,在获取了用户的行为记录之后,通过已构建好的知识图谱,采用服装实体语义相似度的方法找到与该服装相似的其他服装产生进一步推荐。本文提出的基于知识图谱的服装推荐不用考虑传统推荐系统的冷启动问题,同时利用上下文环境,达到了用户特定场景下的需求推荐。
3.本文通过爬取有关服装问句文本数据并将其进行整理,采用CNN-Bi-LSTM-CRF双向长短记忆循环神经网络的实体识别模型识别问句中有关服装实体属性,接着通过识别得到的服装实体属性与已构建好的知识图谱进行SPARQL语句查询,再结合Jena推理机进行规则推理并得到问句答案。最后通过实验对比验证了本方法提出模型的可行性以及该方法更好的理解了用户意图,提升了用户体验。
知识图谱的本质是语义网络,它揭示了世间万物之间的关系。而服装本身自带了诸多属性和知识,但目前知识图谱的研究多数在通用领域,专业领域尤其是服装领域仍处于起步阶段,因此基于服装知识的知识图谱研究具有一定的意义。
智能问答作为知识图谱应用的延伸,它以用户输入的自然语言为基础,通过对语句的理解和知识检索返回给用户相关内容的答案,减少了用户的搜索成本、缩短了用户获取答案的时间,一定程度上弥补了信息检索的不足。目前,许多智能问答平台都将知识图谱与其结合,都有不错的效果。
结合上述,本文研究并实现了一种基于知识图谱的服装推荐和智能问答系统。该系统在用户提交实时服装需求后,利用构建好的服装知识图谱进行推荐,当获取到用户历史数据后,再利用已构建好的知识图谱找到与该服装相似的其他服装产生进一步推荐。同时为了提高交互性和充分利用知识图谱,文本采用智能问答的形式对服装问句进行答案推荐。
本文主要工作如下:
1.通过对用户、服装以及影响服装推荐的情境信息进行分析与整理,明确了服装推荐涉及到的实体、属性、实例等,利用构造本体的方法来定义服装推荐知识图谱的Schema。通过处理及整合获取的服装信息数据源,利用信息抽取对半结构化数据进行知识抽取,并采用基于属性向量的实体对齐方法进行知识融合,利用Apriori算法得到服装与服装、服装与环境之间的关联关系并将其整理为推理规则。最后,本文利用Protégé进行了知识图谱OWL表示和数据生成。
2.提出了基于知识图谱的服装推荐方法。当用户提出需求时,系统通过收集需求信息和调用API接口得到的实时动态情境信息,利用构建好的知识图谱,采用SPARQL查询语句和Jena推理机进行检索并产生初次推荐,在获取了用户的行为记录之后,通过已构建好的知识图谱,采用服装实体语义相似度的方法找到与该服装相似的其他服装产生进一步推荐。本文提出的基于知识图谱的服装推荐不用考虑传统推荐系统的冷启动问题,同时利用上下文环境,达到了用户特定场景下的需求推荐。
3.本文通过爬取有关服装问句文本数据并将其进行整理,采用CNN-Bi-LSTM-CRF双向长短记忆循环神经网络的实体识别模型识别问句中有关服装实体属性,接着通过识别得到的服装实体属性与已构建好的知识图谱进行SPARQL语句查询,再结合Jena推理机进行规则推理并得到问句答案。最后通过实验对比验证了本方法提出模型的可行性以及该方法更好的理解了用户意图,提升了用户体验。