论文部分内容阅读
语言测试的信度是评价语言测试质量的主要指标之一,信度的高低说明了测试结果在多大程度上反映了考生真实的语言能力。测量学的三大理论:经典测量理论(CTT)、概化理论(GT)、项目反应理论(IRT)中都包含了信度问题。本文在前人研究的基础上,借鉴国际和国内测量学界对信度问题的最新研究成果,概括了经典测量理论、概化理论、项目反应理论三大测量理论中关于信度的理论,梳理和归纳了信度问题的理论框架,介绍和讨论了关于信度估计的新热点问题,澄清了一些关于信度的误解,回答了一些广泛存在的疑问。本文指出,信度是测验结果的属性,样本不同则信度改变,它只有大小的问题,并非绝对的有或无。我们在解释合成分数、差异分数时,需要报告合成分数、差异分数的信度数据。测验分数的信度与评分员信度有别,评分员之间的评分一致性并不能说明考生测验分数也具有较高的信度。HSK作为一种标准参照性考试,我们在给出其信度报告时,不应只报告基于常模参照性考试的信度指标,建议同时报告基于标准参照性考试的信度指标,互相参照。