题组测验的等值方法比较研究

被引量 : 0次 | 上传用户:n131421d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在平时的许多测验中都会用到同一试题材料下有两道及以上的题目的测验形式,这就是我们所熟知的题组。在以往的研究中,人们发现题组测验常常会违反项目反应理论中的局部独立性假设。通常而言,学者们忽视项目间相依性的影响,直接采用单维的IRT模型。但是在项目反应理论的框架下,题目间的相依性会影响项目参数的精确估计。随后,学者们提出了用于解决项目相依性问题的题组反应模型,该模型在三参数逻辑斯蒂模型的基础上纳入了题组因子。按照项目反应理论,同一项目在不同的单位系统上虽然数值的表现形式不一样,但是实质是一样的。因此,可以将新测验上的参数转换到基准测验上。Haebara(1980)通过最小化两种测验间的差异发展出了一种最小二乘法,称为项目特征曲线等值法(简称为Haebara法)。随后,Stocking和Lord (1983)提出了一种更精确复杂的方法。他们通过极小化各测验间的真分数之差提出了测验特征曲线等值法(简称为SL法)。受到卡方检验的启发,Xiong和Ding (2005)发展出了一种Haebara加权法,他们通过模拟研究发现该方法优于Haebara法。同年,他们又提出了平方根等值法,这是受到Freeman-Turkey多项分布拟合检验的启发而形成的,这种方法也可以看作是一种Haebara加权法。该方法具有答对的概率和答对的概率同时出现而不能够相互替换的特点。因此,平方根等值法可以极易从二级评分模型转换到多级评分模型中。在许多大型测验项目中,测验等值对于考试的公平性、题库建设和计算机自适应测验都具有重要意义。将题组模型应用于不同形式的题组测验等值是非常有必要的。然而,大多数都对题组测验等值方法的研究相对较少。因此,本研究的主要目的就是将等值方法应用于题组等值中,并且通过实证研究和模拟研究比较这些等值方法的表现。本研究首先通过两个实证数据比较不同等值方法的表现。这些实证数据来源于一个英语测验。每一个测验包含五个题组,每个题组有3至20道的题目不等。共有815个被试同时参加了两个测验,采用的是平衡组设计。实证研究将传统的等百分位等值作为评价标准。结果表明,Haebara加权法的表现优于Haebara法,SL法和平方根等值法的估计结果和传统的等百分位等值法较为接近。模拟研究通过改变样本量、题组效应大小和题目数三个条件来比较不同等值方法的表现。模拟研究结果和实证研究的结果较为一致。
其他文献
时间贴现是指个人对事件的价值量估计随着时间的流逝而下降的心理现象,它是行为选择理论的一个重要组成部分。行为经济学将个体的认知特点等心理因素包括到对经济行为的研究
房地产开发企业土地储备除了从土地公开招拍挂交易市场获取外,也常通过土地二级市场渠道获取项目。随着二级市场存量土地的增多,房企获取土地方式也呈现出多种模式。鉴于此,
目的研究皮肤病患者心理健康水平和人格特征,分析护理干预对其的影响。方法选取我院2014年9月—2016年9月期间收治的皮肤病患者92例作为研究对象,所有患者均给予护理干预,另
目的:制备和评价马钱子碱聚乳酸载药纳米粒(B ru-PLA-NPs)。方法:采用溶剂扩散法制备B ru-PLA-NPs,并对其进行表征和体外释药评价。结果:制得的B ru-PLA-NPs的平均粒径为95 n
和谐社会的构建以成为当今中国社会建设的一个目标,如何通过和谐校园文化构建,提高大学教育的绩效,为和谐社会培养培养全面发展的优秀人才,本文做了一些粗浅的探讨.
随着知识经济的到来和市场竞争的日益激烈,人力资源在企业发展中扮演重要角色,高质量的人力资源已成为一个企业发展的真正动力和源泉.培训是人力资源开发的重要组成部分,因此
以粤北连南瑶族自治县八排瑶油岭村为例,以排瑶传统聚落为研究对象,通过质性研究、历史文献分析、地理信息分析等方法,研究排瑶传统聚落空间格局特点与景观特征。结果表明:①
介绍了一种采用套管刮刀或结晶器、离心机及降膜式结晶器等关键设备精制对二氯苯的工艺技术。结合生产实际应用情况对该技术装置进行了剖析。指出其优点及不足之处,提出相应的
高校思想政治理论课教师的专业素养由专业精神、专业知识和专业能力三方面构成。高校思想政治理论课青年教师专业素养的培育要通过加强专业制度建设、专业精神培育、专业知识
<正>CAD/CAM/CAE能显著地增强企业的开发手段,缩短新产品上市时间,提高企业的形象,因此,成为各行各业技术投入的热点。然而,面对竞争激烈且发展迅猛的CAD市场,往往令选型人员