论文部分内容阅读
考试是衡量人们知识技能程度的重要手段,在我国,考试的存在已有两千多年的历史。但传统的纸笔考试大都以经典测验理论为基础,考试以固定的考题考核所有学生。其主要弊端是,每个特定的学生都有许多不是适应其水平的试题,高水平与低水平的考生均一律对待,考试中包含的所有难题与易题都要求作答,考分难以严格区分考生真实水平的差距。而计算机化自适应考试(computerized adaptive testing,CAT)基于项目反应理论,是一种方兴未艾的考试形式。CAT的优点是打破了传统考试“一刀切”策略,能根据考生水平差异“因人施测”,每个考题根据考生答题表现,动态抽取;考试往往时间短,结果更科学,效果亦更好。美国研究生入学考试(Graduate Record Examination)、工商管理类研究生入学考试(Graduate for Management and Administration Test),以及全美护士国家委员会资格考试(Nurse National Committee License Test)等都已经开始使用CAT的形式。在国内,微软的MCSE考试和GRE/GMAT英语考试己经开始采用自适应考试形式。但是我国CAT使用总体情况是:CAT使用规模很小;实用的CAT、特别是B/S模式设计的CAT很少;现有的CAT中,很多能力估计和选题方法的选用相对过时。因此,CAT在我国还有很大研究和推广的空间。本文在系统学习了自适应考试的相关理论、Web设计技术和数据库设计等知识的基础上、设计并实现了一个基于Web的自适应考试系统。CAT主要有两个核心和关键问题,能力估计方法是一个关键问题,考试的不同阶段该选用什么能力估计方法,并无固定模式。文章在对现有方法充分分析和实践探索基础上,针对不同能力估计方法的优缺点,在不同的能力估计阶段,选用了恰当的能力估计方法。选题策略是另一个核心问题,经过对多种选题方法的综合比较,按b(难度)分层是一个很好的选题方法,但针对不同的考试规模和应用背景,b应分成几层最佳?经过笔者的理论研究和实验比较,给出了针对三种考试规模下b的最佳分层数。本文首先阐述了CAT的概念、研究现状、研究意义、CAT相关理论基础、数据库设计技术和Web设计技术;然后详细分析了系统的总体设计和各模块设计,以及在考试过程中所遇到的问题和解决方案;论文结尾通过实验给出了对CAT中能力估计和选题方法的探索结果;最后对自适应考试系统进行了总结,并且进一步展望了在线自适应考试系统今后的发展研究方向。