论文部分内容阅读
近年来,随着国民健康意识的提高,人们越来越重视饮食均衡和维护身体健康状况,饮食作为人们在日常生活中最为关注的事情之一,以科学的营养学知识为依据,为国民提供食物、营养的建议具有重要意义。大数据和人工智能技术的高速发展为营养学的研究提供了新的角度。本课题主要基于专业的营养学书籍和网站中的营养学数据,构建了营养学知识图谱并研究了知识图谱的补全方法。我们开展了以下几项工作:(1)本文首先构建了营养学知识概念及关系体系,给出了营养学知识图谱中实体类型以及实体间关系的定义并给出了相关的样例说明。营养学知识图谱中主要包含八种类型的实体和十二种类型的实体间关系。本文获取了《临床营养学》、《中国居民膳食指南》、《中国食物成分表》和39健康网、美食杰网站中的营养学数据。通过对其进行命名实体识别、实体对齐、知识表示等工作,基于词数据构建了营养学知识图谱。(2)接着,本文对营养学知识图谱的关系构建进行了研究。由于知识图谱的数据总是不完备的,为了解决实体间关系缺失的问题,本文提出了营养学实体关系分类模型。使用R-GCN模型和多头注意力机制提取知识图谱中营养学实体的特征,进行分类预测实体间潜在关系。实验对比了基于传统机器学习方法的关系分类模型,结果表明了本文所提出方法的优势性。(3)最后,本文提出了营养学知识图谱补全方法。为了更加全面地考虑三元组中实体与关系间的联系,提出了基于知识表示的链路预测方法来进一步填充不完整的三元组。我们统计分析了营养学数据的特点,并使用Trans E和Rotat E等模型来对营养学知识图谱中的节点进行表示学习,对链路预测进行了实验。此外,还探讨了不同的负例生成方法对链路预测结果的影响。总的来说,本文围绕营养学领域,深入研究了营养学知识图谱的构建,以及营养学知识图谱的补全问题,为基于营养学知识图谱的饮食推荐研究铺平了道路。