基于领域知识图谱的学术资源推荐算法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:fgjfg111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术蓬勃发展的时代,学术资源的数量持续增长。面对海量学术信息,推荐系统是最高效的信息过滤方式之一,有效地缓解信息过载从而提升资源的利用率。学术资源具有多类型、异质等特性,而用户具有多样的、潜在的兴趣与倾向,传统推荐方法容易受到数据稀疏性、推荐结果少多样性等问题的影响,目前有效的缓解办法是融合辅助信息到推荐系统。知识图谱辅助的推荐方法作为近几年研究热点,能有效组织学术资源所蕴含的丰富关联信息,将知识自然地融入推荐系统,提升结果精确性和多样性。针对以上的问题,基于知识图谱的优势,本文以学术论文的推荐为研究切入点,围绕知识图谱辅助的论文建模和用户阅读偏好建模、基于用户偏好的个性化论文推荐等方面,研究如何更加精准地推荐个性化的学术论文。本文的研究内容与主要贡献如下:首先,为了研究知识图谱如何融入论文推荐,本文提出一种基于知识图谱的论文推荐框架KIRec,尝试用协同知识图谱的特征提升论文推荐的性能。将交互数据和元数据抽象成实体和关系,基于用户-项二部图构建协同知识图谱;使用注意力网络区分用户交互记录对用户偏好的贡献,最终指导用户节点邻域的融合。为了在KIRec框架上进一步在知识图谱中探索用户潜在而多样的兴趣,本文提出一种基于用户显隐式阅读偏好的推荐算法GNPR。这次先构建概念级的知识图谱,基于改进的GCN模型探究用户隐式兴趣;此外,融合了文本特征所体现的显式兴趣,提出双层自注意力机制用获取文本内在的全局特性,帮助捕获更全的用户显式兴趣。其次,为验证KIPRec和GNPR的可行性和对比基线方法的优劣,基于互联网开放的论文推荐数据集和真实学术推荐应用的日志数据,本文设计并实施了一系列实验。实验表明,融合知识图谱和文本特征的用户兴趣建模方式更能提升论文推荐效果。同时采用消融实验,验证了模型变化结构与完整模型的实验效果,即注意力机制模块、知识图谱表示学习模块和用户-论文交互建模等局部设置的有效性。最后,为探究KIRec框架和GNPR算法在工程应用中可扩展性,本文设计和实现了多类型学术资源推荐系统“学术头条”。该推荐系统将以上方法应用在论文、专利、图书和新闻等多种类型资源的推荐场景,比传统基于内容和基于图的方法更能满足用户的需求,体现了知识图谱辅助推荐系统的应用优势。
其他文献
学位
相变存储器(PCM)因其低功耗、存储速度高、寿命长、低成本、非易失性等优点,将成为未来存储器的主流产品,然而直接决定PCM性能的是其作为存储介质的相变材料。众所周知,Ge2Sb2Te5(GST)为最常见的相变材料之一,但其存储器件表现出的热稳定性较差,功耗较高,可靠性较低等缺点,需要有待改善。为提高其相变材料的性能,用结晶温度、晶态电阻相对较高的ZnSb来代替GST,但在研究过程中,发现ZnSb在
由于高分辨距离像(HRRP)易于获取和存储,基于高分辨距离像的目标识别研究成为雷达目标识别领域的热点。本文围绕基于高分辨距离像的目标识别展开研究,主要贡献在于提出了可学习先验卷积变分自编码机和解耦表征卷积变分自编码机。二者在原始变分自编码机的基础上融入类别标签监督信息,以此更加有效的提取高分辨距离像特征。本论文的内容主要包括以下部分:1.研究了高分辨距离像目标识别的基本框架。具体对高分辨距离像的敏
印制电路板(Printed Circuit Board,PCB)作为各类电子信息产品的重要部件之一,其主要功能是支撑和互连电路元器件。而且,消费者对电子产品在智能化、轻薄化、小型化以及多功能化等方面的需求增长驱动着印制电路板不断向着高精度、高密度和高可靠性方向发展。通孔电镀铜是连接多层电路板的层与层之间的“桥梁”之一,并对下一代先进印制电路板制作有着重要指导意义。然而,直接采用直流电源进行通孔电镀
大量研究表明,在很多生物过程中,长非编码RNA(lncRNA)有着重要的功能,它们调控生物的生理过程,影响着细胞内稳态的各个方面,而这些lncRNA的变异或功能失调有可能导致一些复杂疾病的发生。lncRNA由于其在多种生物学过程中的关键作用,正成为生物学和医学领域的研究热点,在多种肿瘤疾病中具有潜在作用,有望成为新生物标志物和药物靶标。利用计算生物信息学方法预测潜在的lncRNA-疾病关联,对于探
粮食安全问题是关乎人们生存及健康的基本问题。40多年以来我国粮食产量和种类一直在增加,其品质也一直在提升,这靠的是政策和制度,同样也靠科学技术。科学技术在农业中的贡献率高达60%以上,对我国粮食的增产发挥了巨大的支撑作用。尽管如此我国农作物仍不同层度地受着植物病虫害的侵害,而寻找更多结构新颖的微生物农药来替代化学农药是解决粮食安全问题的一大方向。本文旨在明确放线菌JN18的生物学基本信息,并为其作
研究背景及目的:乳腺癌是一种激素依赖性的肿瘤,其发病率在全球范围内逐年增加,已居于中国妇女恶性肿瘤发病的第一位,是女性癌症患者最主要的死亡原因之一。乳腺癌的发生除了与雌激素、瘦素等多种内分泌激素有关外,机体微环境的免疫状态对乳腺癌的形成也发挥着重要作用。当机体处于免疫抑制状态,特别是局部微环境中抑制性T细胞亚群数目、比例发生失调,可形成免疫抑制网络,从而保护肿瘤逃避免疫攻击,导致肿瘤生长、浸润及转
纤维素的生物降解是通过微生物来源的纤维素酶的协同作用来水解纤维素,具有过程简单、转化率高、无污染等优良特点而被广泛应用。纤维素酶是一种多组分酶,包括纤维二糖水解酶、内切葡聚糖酶、β-葡萄糖苷酶等。其中,β-葡萄糖苷酶能将纤维二糖降解为葡萄糖,有效提升了水解产物对纤维素酶的抑制作用,是纤维素降解过程中的关键限速酶,其已在工业、农业、食品、医药、生物能源等领域广泛应用。β-葡萄糖苷酶主要来源于天然的植
深度学习技术日渐成熟,使得计算机视觉领域相关问题的研究进程得到了加速。在卷积神经网络问世以前,学者们通过构造人工特征来完成各项任务。但这种方法需要进行大量的数学运算,在复杂度以及效率方面存在较严重缺陷。卷积神经网络的出现,实现了对图像特征的自动提取,并且有相关资料表明,使用深度卷积神经网络得到的特征比人工特征具有更强的表述能力,基于深度卷积特征的算法往往能够获得更显著的分类效果。基于强监督的分类算
目的:本研究通过收集广州中医药大学第一附属医院及广东省9家合作医院2015年1月至2017年10月输卵管妊娠患者,以邓高丕教授及其团队制定的“输卵管妊娠的中西医结合诊疗规范”为依据,将病例分为中医治疗组和中西医药物治疗组。分析比较各组停经天数、住院时间、住院费用、治疗前输卵管妊娠的病情影响因子评分(简称“评分”)、血人绒毛促性腺激素(β-HCG)值、孕酮(P)值、B超输卵管妊娠包块最大径、B超盆腔