基于文本大数据的汉语言教学素材推荐方法研究

来源 :江苏师范大学 | 被引量 : 0次 | 上传用户:abby412
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的高速发展加快了大数据时代的来临,汉语言教学素材在互联网上急速聚集,在为语言学习者提供丰富资源的同时,也增加了他们选材的难度。研究推荐方法和技术是实现在浩如烟海的网络资源中,快速、准确定位优质汉语言教学素材的有效途径。为此,教学素材的推荐工作也得到了领域专家的高度重视,但遗憾的是,围绕教材编纂、同步学习等方面的推荐方法的研究还不够充分。随着以数据挖掘为主要代表的大数据分析技术不断发展,为研究汉语言教学素材的推荐方法奠定了基础。鉴于此,本文充分考虑学习者的认知特点,借助文本大数据处理与分析技术,从“学”,“读”,“练”三个角度探索了语文教材选文、语文课程同步读物及个性化习题的推荐方法,主要分为三个部分:首先,探讨了文本类教学素材的量化过程,提出了可捕获文本语义信息的文本矩阵表示方法。在广泛收集学生日常用语和读物的基础上,通过分词、词频统计、词聚类和词包分解等操作,生成词汇序表,并充分考虑学生的认知特点和接受度,确定各学段的必学词汇表。而后,基于必学词汇表,给出了半自动化的语文教材选文推荐方法,并通过实验验证了该方法可有效地提高教材选编的自动化程度。其次,为配合“读写”教学法的推广,避免字词强化教学方法的不足,本文系统研究了课程同步读物推荐方法,力求通过推荐符合学生学习规律、与课程学习相同步的读物,助力读中学、学为读的教学方法的推广。本研究以艾宾浩斯遗忘曲线和“i+1”输入原则为推荐依据,设计了基于旋卷式分类的课程同步读物推荐算法,实现为学生推荐与课文匹配度较高的读物。同时,通过实验验证了本文方法的实用性。最后,研究了个性化习题推荐技术。本文提出了题向量编码方法,讨论了习题之间的伴生现象,构建了基于深度学习的题向量化模型,设计了高效的负采样训练方法,用以捕获习题间的伴生关系,生成题向量。借助题向量,可方便地计算习题间的关联度。对于那些关联度高的习题,通常具有伴生出错的现象,基于该现象,可根据学生的错题进行重点推荐。实验结果表明,题向量能较为准确地分析出习题间的关联关系并预测特定个体的易错习题,较相关算法具有明显优势。
其他文献
随着我国工业整体实力的提升和相关行业的飞速发展,工业生产方面对钢铁材料的质量水平要求越来越高。因此,在钢铁材料出厂时,必须对成品进行力学性能指标的检测,判断其是否符
从2013年开始,随着手游行业的爆发式增长,资本市场上掀起了一股收购手游公司的热潮,高价并购交易频现。手游公司独特的运营模式,收购方多样的业务背景,使投资者在理解这些交
本文旨在对常见资产配置模型在对冲基金策略领域进行比较性的实证研究,并应用于中国私募证券基金的基金的产品设计中。采取“两步走”--先配置后择基的方法,本文通过滚动窗口
随着网球运动的不断发展与演变,网球的技战术打法也在不断更新与完善。技战术作为比赛最主要的影响方面不仅个人存在着差异,而且在个人的某个职业生涯时期同样存在着差异。本文将费德勒职业生涯在澳网赛事与对手的技战术特征作为研究对象,采用文献资料法、数理统计法、对比分析法等多种研究方法对费德勒与对手多年的比赛数据进行分析研究,从技战术指标中找出影响比赛的关键指标,并对不同时期关键指标之间的动态变化剖析其变化的
生命责任心是个体在生存和发展过程中对生命负责的一种重要心理品质,也是心理健康的一个重要衡量标准。生命责任心是一个囊括了生命责任认知、生命责任情感和生命责任行为的
《九年义务教育全日制初级中学英语教学大纲》要求要培养学生良好的学习习惯和学习方法,发展学生的自学能力,而在实际教学过程中,教师对教学形式、教学方法的研究较多,对学生
赛后即时采访作为体育赛事传播的重要组成部分,是赛事现场信息的重要补充,是信息准确传递的关键一环,是受众获取新闻现场实况、进行视听延伸的有效桥梁,是记者实现自我价值的
物业服务合同纠纷是指在合同履行过程中,订立合同的各方当事人和政府行政主管部门等因物业的使用、基础设施维修等活动中发生的争端和矛盾。当前常见的纠纷类型主要包括:管理
本文中,我们试图分析A股市场中交易订单不平衡带来超额收益的市场异象并以此开发交易策略。通过使用A股历史交易数据探究订单不平衡与股票收益之间的关系,我们发现随着订单不
目的:探讨核受体RORα在心肌肥厚中的作用以及潜在的具体机制。方法:10-12周龄SPF级C57BL/6J(WT)小鼠,RORαsg/sg纯合小鼠和心脏RORα特异性过表达(TG-RORα)小鼠随机分为假手术(S