基于知识图谱的OJ题目推荐算法的研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:lmh116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线评测(Online Judge,OJ)系统为编程用户提供自主练习的平台,而OJ系统中大量的题目造成编程用户的选题困扰,因此在OJ系统中添加题目推荐模块对于编程用户而言具有重要作用,可以辅助他们进行题目的选择,节省选题时间。本文首先根据学生做题通过率进行题目推荐,通过率高的题目学生容易做对,能增加其做题兴趣,所以算法的目的是给学生推荐通过率高的题目。算法使用深度知识追踪(Deep Knowledge Tracing,DKT)模型预测做题通过率,将DKT原本输入变为题目编号,并增加额外信息,同时对输入进行压缩,实验结果表明预测效果比DKT模型有所提高。后续根据预测结果进行推荐,提高推荐算法的可解释性。其次本文在传统推荐算法的基础上,将协同过滤和基于内容的推荐相结合进行混合推荐。通过在协同过滤中引入题目文本信息弥补它忽略题目本身内容信息的缺陷。针对OJ题目有相应的文本描述信息和若干知识点组成的特点,文中将其看作小型知识图谱,利用BERT(Bidirectional Encoder Representations from Transformers)模型将文本向量化,并融合到协同过滤中,提高推荐结果。本文具体研究内容如下:(1)首先预测学生做题通过率。本文使用DKT模型预测做题通过率。现有的DKT模型将同一知识点下的题目看成是同一题目,这样会导致无法根据每道题目自身的特点进行精确的预测。因此,选择将题目进行输入,此时输出的也就是每道题目通过的概率,有助于提高预测的效果。但这种方式也会产生输入的题目之间相互独立且使得输入维度过大的问题。为了解决这两个问题,文中的算法先在输入中增加了知识点信息,建立题目之间的联系,之后将输入维度进行压缩,防止维度过大影响训练的效率。在Codeforces(CF)网站数据集的测试中表明,改进后模型的预测效果有所提高。(2)进行了OJ题目知识图谱的构建。利用了CF网站上提供的知识点、题目和难度信息作为知识图谱的实体,并定义了他们之间的关系,根据专家意见和算法竞赛教科书定义知识点之间的关系。(3)将每道题目文本描述及其包含的若干知识点看成小型知识图谱,利用该数据信息进行题目文本嵌入,整个过程看作是文本分类,用BERT模型及后续添加的微调层获得题目文本向量,再将向量用于协同过滤算法进行混合推荐。(4)基于上述的算法和工作,本文提出了两种题目推荐的策略。一是利用已经预测的题目通过率,根据排序结果推荐通过率高的题目。二是利用知识图谱进行题目推荐,利用知识图谱的概念将题目文本向量化,将该文本内容信息融合到协同过滤算法中,进行混合推荐。
其他文献
随着信息技术的不断发展,数据处理量不断增大,如何在海量、高维度的数据集中进行快速搜索显得越来越重要。数十年来,近似最近邻搜索(Approximate Nearest Neighbor,简称ANNS)一直是一个热门话题,它在数据挖掘,机器学习和人工智能的许多应用中发挥着重要作用。对于稀疏的离散数据(比如文档),用户可以构建高级索引结构(比如倒排索引)来进行有效地最近邻搜索。但是对于密集的连续向量,目
中国是鞋品制造大国,每年制鞋业为我国创造巨大经济利润。然而制鞋业主要集中于东南沿海,近年来劳动力成本不断上升,同时我国鞋品生产设备落后,自动化程度不高造成了鞋品一致性差、生产效率低、一线工人工作强度大等问题,上述问题对我国制鞋业的发展产生很大限制。本课题来源于国家重点研发计划“面向运动鞋服行业的机器人自动化生产线”,根据冷粘制鞋行业的实际情况,对工业机器人鞋帮打粗作业进行相应研究,提高了冷粘线鞋帮
纺织布匹瑕疵检测是纺织品生产环节中至关重要的一步,如何更进一步的提高纺织布匹瑕疵检测的精度和速度将对这一重要的生产步骤产生十分积极的影响,这能够有效的促进纺织品行业持续健康的发展。因此,本文特别针对纺织布匹瑕疵检测环节中的检测精度和速度这两个方面展开了细致的研究,本文完成的主要创新工作如下:针对目前业界前沿的目标检测算法在织物布匹瑕疵的检测精度方面仍然存在有待提升空间的问题,本文提出了三种不同的技
目前在纺织领域,工厂主流的布匹质检方式为人工检测。随着工业智能化的发展,机器视觉技术凭借其检测速度快和精度高的优势,得到了纺织领域的更多关注。部分纺织企业开始使用基于机器视觉的布匹瑕疵检测系统,目前的瑕疵检测系统主要用于素色布的瑕疵检测。根据工厂实际生产的布匹情况,结合消费者对服装布匹的需求,发现以复杂背景图案的花色布为主。由于花色布的瑕疵特征提取受到复杂背景图案的干扰较大,而传统机器视觉的算法依
伴随互联网技术的更新换代、不断发展,人脸识别技术被应用于生活的各个角落,依托于人脸识别技术的产生带来了诸多的便利,相应的推动了研究学者对于依托新兴产业的识别技术的深入研究。如今,人脸识别技术已经由传统的模板匹配、几何特征等识别方法过渡为基于神经网络的人脸识别方法,在基于实验环境下的识别效果甚至已经达到精准识别的水平。但是,在基于非理想状况的现实生活中,人脸识别的效果受到很多因素的影响,包括光照、遮
经编提花鞋面的数量统计和质量检测是制鞋过程中的一个重要环节。目前,工厂主要采用人工检测方法,通过人眼视觉来检测鞋面布匹是否存在质量问题,手工标记存在质量问题的鞋面,并且人工统计合格鞋面的数量。这种检测方法存在着检测速度慢、检测准确率不高、劳动强度大等弊端,降低了企业的市场竞争力。利用机器视觉技术代替传统人工检测,是一种提高鞋面布匹检测效率和精度的重要途径。本课题以经编提花鞋面布匹为研究对象,利用机
熔体直纺长丝作为一种重要的工业纺织品生产原料,在生产生活中用途十分广泛。为方便熔体直纺长丝的存储和运输,化纤企业通常将其卷绕成化纤丝饼。在卷绕过程中,熔体直纺长丝由于导丝辊拉力不稳定以及挂钩处局部受力不均等因素影响,部分纺丝会发生断裂并出现长丝局部断头现象。企业将熔体直纺长丝局部断头的严重程度作为评判化纤丝饼质量等级的主要指标之一。目前,由于缺乏熔体直纺长丝断头自动化检测方面的相关研究,化纤生产线
近些年来随着算法、算力、数据快速地发展,人工智能的发展遇到了新一轮的机会。在本次浪潮中各行各业都受到了人工智能的影响,尤其互联网企业在本次浪潮中得到了更多的发展契机,其中在线医疗、电商、文娱等相关领域分别从人工智能技术中受惠,且人工智能也催生了一批基于人工智能技术主导的公司。本文以A公司智能客服项目作为风险管理研究对象,结合经典的风险管理理论,对项目开发过程中所面临的内外部风险进行识别、分类以及进
地域文化是城市文化的集中体现。城市的自然状况、历史底蕴与人文环境造就了城市独特的地域文化特色。导视系统作为区域的信息识别设施,除了具有方向指示的功能外,同样承载着地域文化的历史印记。基于地域文化的导视系统,对场所历史及文化的体现有着重要的作用。本研究以石库门地域文化为研究对象,探索地域文化特征应用于导视系统设计的创新方法。首先,明确地域文化的隐性特征和显性特征的提取方法,并对石库门地域文化和老码头
随着在线社交网络的发展,社交平台下的用户群体也日渐壮大。新浪微博平台注册用户接近四亿,活跃用户超过一亿,是目前国内最大的微型博客社交平台。用户可以发布微博来分享信息,其它用户也可以通过评论或转发来对信息做出反馈。庞大的用户群体使得在新浪微博平台上有诸多类似于广告营销的应用。如何将微博下的社交网络特点利用起来,高效地进行广告营销,是一个很有研究价值的问题。构建社交平台上的用户影响力传播模型,利用用户