高考历史简答题自动评价方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zywlaoying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高考是全国范围内最重要的考试之一,试卷评阅质量是决定考生得分的关键环节。高考题目中的主观题包括简答题、论述题、作文题等多个类型,目前全部由人工阅卷评分。但该过程会受到多个因素的影响,例如阅卷人对所判科目的理解全面程度,答题人所列要点清晰程度、卷面整洁程度等,并且阅卷工作量巨大,将耗费一定的人力和时间。因此我们考虑使用自然语言处理方法初步探索用计算机阅卷的可能性。本题目实质上是研究简答题的学生答案与标准答案间的文本相似度和学生答案得分之间的联系,而文本间的匹配可以通过建立多种不同的模型来实现。本文主要从以下几个方面探索了学生答案和标准答案间的相似度:第一,计算文本间的N-gram共现准确率、召回率等是基本思路。我们分析总结了BLEU和ROUGE所使用的N-gram共现计算方法,并将它们应用到了简答题自动评价问题中。我们使用了spearman秩相关系数在答案数据集上检验N-gram共现特征与数据得分之间的相关性。最后通过传统的机器学习方法——排序支持向量机(Ranking supporting vector machine)在这些特征上筛选得到能使模型排序效果最好的特征集合。第二,我们认为仅靠N-gram共现特征是不够的。浅层语言学知识包括词法、句法和语义三个方面,其中词法和语义特征都是需要进一步探索的。文本是由许多不同的词组成,词性不同的词在句子中的重要程度也不同。显然,在学生答案与标准答案间共现的词中动词、名词可能会比其他词性成分重要。因此我们将计算基于词性的词汇共现特征。另外,我们还可以将名词进一步延伸为特定的历史学相关专有名词,也具有一定重要性。语义相似度上我们应用了信息检索中查询与文档间的相似度计算方法。第三,深度学习已逐渐从最开始的计算词的分布表示逐渐发展到计算包含更多语义信息的短语、句子、文本等。词向量一个最基本的应用是计算两个词语的语义相似度。相应的,当我们根据一个完整的语料库训练出的模型得到的句子向量,也应能够给出两个句子的语义相似度。我们利用深度学习中神经网络的方法将学生答案和标准答案表示成包含丰富语义信息的句向量,并将向量间相似度作为学生答案和标准答案间的语义相似度。
其他文献
ControlNet是由罗克韦尔自动化公司推出的一种开放的国际标准现场总线,是面向控制层的高速实时控制和I/O网络,对于离散和连续过程控制应用场合,均具有确定性和可重复性.本文
介绍了模糊评价方法与计算机软件技术相结合的典型实例一农业部环境分析评价系统。并叙述了模糊评价方法的内容,结合源代码对模糊评价在环境分析评价系统中的具体实现情况进行
蚯蚓是土壤污染状况的重要指示生物之一。近年来,蚯蚓生态毒理试验广泛应用于污染土壤的质量评价,其试验方法及评价指标日趋完善。概述了蚯蚓生态毒理诊断的一些试验方法,包括急
意境作为中国传统美学的一个重要范畴,它是构成艺术美的不可缺少的因素,历来都受到中国画家的重视。工笔人物画作为中国画重要的组成部分,在现代得到了飞速发展。作为一个工笔人
爸bà爸bɑ的de爱ài,  像xiànɡ大dà地dì。  我wǒ是shì小xiǎo树shù,  根ɡēn怎zěn么me扎zhā也yě扎zhā不bú到dào底dǐ。  爸bà爸bɑ的de愛ài,  像xiànɡ大dà海hǎi。  我wǒ是shì小xiǎo鱼yú,  怎zěn么me游yóu也yě游yóu不bú到dào边biān。  323000 浙江省丽水市实验学校小学部104班
漆艺在中国已有七千多年的历史,新石器时期河姆渡人就掌握了髹漆术,历史上战国、汉、唐等时期,中国漆艺已发展至鼎盛时代.漆画应该说是古老而又年轻的画种.自第六届全国美展
期刊
目的通过临床试验研究使用曲美他嗪在治疗冠心病合并左心功能不全的患者的疗效和耐受性。方法选择医院自2013年1月~2014年1月医院接受治疗的患者120例,经临床检查发现患者都
2010年9月高中新课程改革在青海省展开,2012年2月10日,教育部首发了三个教师专业标准,在《专业标准》中规定了教师专业发展三个维度:专业理念与师德、专业知识、专业能力,在
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield