论文部分内容阅读
对一项测试而言,效度是决定其质量的重要因素之一。因此,一项语言测试的质量究竟如何需要经过科学合理的效度验证才可得以证实。目前,语言测试领域中有关大学英语四、六级,英语专业四、八级考试的效度验证研究案例屡见不鲜,却很少有研究对我国同样大规模、高风险的英语考试(即中考英语)进行全方位的效度验证。本研究选取我国的中考英语阅读测试和国外较权威的初级托福阅读测试作为研究对象,借鉴Weir(2005)的效度验证框架,对比分析了这两项英语阅读测试效度的异同之处,旨在一方面丰富语言测试领域中有关中考英语的研究文献;另一方面为我国中考英语测试和中学英语教学的进一步改革与发展提供有意义的参考建议,促进我国语言测试与国际语言测试早日接轨。 本研究以Weir(2005)提出的效度验证模式—“基于证据的方法”为理论核心,对我国中考英语阅读测试和国外初级托福阅读测试的效度展开探索性的对比研究,主要回答如下几个问题: (1)在两项英语阅读测试中,分别涉及到受试者的哪些生理、心理和经历特征?他们完成这两项阅读理解任务的认知过程和交互活动在多大程度上是真实的? (2)两项测试任务的环境和操作在多大程度上对所有受试者是公平的? (3)两项测试的分数在多大程度上是可靠的? (4)两项测试的相关性如何? 首先,本研究选取2015年中考英语试卷(重庆卷)和一套初级托福阅读试卷作为研究工具。接着,选取重庆市某一中学初三某班的97名学生作为研究对象,根据Weir(2005)的效度验证框架,从以下几个方面收集这两项英语阅读测试的效度证据: (1)对受试分别进行两项英语阅读测试前,了解考场的物质环境,确保两项测试的环境效度。 (2)每项考试一结束就随机选取3名受试者进行“即刻内省”实验,要求他们回顾完成这两项英语阅读理解任务的认知过程和交互活动,用以验证基于理论的效度。 (3)两项阅读任务施测结束后,对所有受试进行问卷调查,收集他们完成这两项阅读测试时涉及的生理、心理和经验特征的数据,并深入了解他们对这两项阅读测试的任务设计、任务要求和场合与施测的观点,进一步为环境效度和基于理论的效度提供效验证据。 (4)最后为本研究提供有效数据的77名受试的两项阅读任务的分数用于对评分效度和效标关联效度的验证。运用数据软件SPSS19.0,分别计算出了这两项阅读测试的难度、区分度和信度指数,并且通过描述统计和推断统计的方法检验了这两项阅读测试的相关程度。 本研究借助Weir的效度验证框架,在对比和分析中考英语阅读理解和初级托福阅读理解的效度过程中,有如下发现。问卷调查的结果显示在两项英语阅读测试中,少部分受试的身体不适,心理上有紧张感,受试者对中考英语阅读的熟悉度远远高于对初级托福阅读测试的熟悉度。中考和初级托福的阅读理解考察的阅读技能基本相似,然而在“即刻内省”实验中发现受试在中考阅读中的答题行为较初级托福阅读中的答题行为更真实。在环境效度方面,两项英语阅读测试的物理环境对所有受试都是公平的。然而,在操作上由于受试对初级托福考试的不熟悉及其自身的难度导致中考阅读比初级托福阅读更公平。项目分析的结果证实,与中考英语阅读理解的题目相比,初级托福阅读理解的题目难度偏高,区分度偏低。中考英语阅读测试和初级托福阅读测试由分半法所测的信度系数分别为0.676和0.546,因此前者较后者更可靠。此外,皮尔逊积差相关分析方法计算出中考英语阅读理解和初级托福阅读理解的相关系数为0.583,表明这两项阅读测试显著相关,但相关性仍不够理想。初级托福阅读测试