- 余娜;辛涛;
认知诊断理论是基于项目反应理论的新一代测量理论,在教育测量实践中具有广阔的应用前景。诊断理论的研究主要围绕诊断模型的提出、模型诊断性能的评估、模型诊断结果的报告三个方面展开。认知诊断研究在上述三个方面的进展促进了诊断模型理论建设的深入与应用范围的拓展,但是在模型的外在效度、模型的群体诊断结果、模型的选择与比较、多分项目的诊断模型以及不同诊断测验之间的等值方面仍需进一步研究探索。
2009年03期 v.5 22-34页 [查看摘要][在线阅读][下载 321K] [下载次数:1549 ] |[网刊下载次数:0 ] |[引用频次:55 ] |[阅读次数:2 ] - 余娜;辛涛;
认知诊断理论是基于项目反应理论的新一代测量理论,在教育测量实践中具有广阔的应用前景。诊断理论的研究主要围绕诊断模型的提出、模型诊断性能的评估、模型诊断结果的报告三个方面展开。认知诊断研究在上述三个方面的进展促进了诊断模型理论建设的深入与应用范围的拓展,但是在模型的外在效度、模型的群体诊断结果、模型的选择与比较、多分项目的诊断模型以及不同诊断测验之间的等值方面仍需进一步研究探索。
2009年03期 v.5 22-34页 [查看摘要][在线阅读][下载 321K] [下载次数:1549 ] |[网刊下载次数:0 ] |[引用频次:55 ] |[阅读次数:1 ] - 杨璐;吴圣;
教育关系民族兴衰,是一国提高综合国力和在人才竞争中取胜的关键。古往今来,考试成为检验教育质量的首选方法,平等竞争是考试的灵魂,公开和公正是考试制度中录和用的基本原则。但我国各类考试中考生舞弊、考官徇私的事件层出不穷,严重损害公民的平等受教育权,亟待将考试制度纳入法治范畴,而现行考试法体系存在的固有缺陷更加使得考试立法迫在眉睫。
2009年03期 v.5 35-45页 [查看摘要][在线阅读][下载 129K] [下载次数:180 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:1 ] - 杨璐;吴圣;
教育关系民族兴衰,是一国提高综合国力和在人才竞争中取胜的关键。古往今来,考试成为检验教育质量的首选方法,平等竞争是考试的灵魂,公开和公正是考试制度中录和用的基本原则。但我国各类考试中考生舞弊、考官徇私的事件层出不穷,严重损害公民的平等受教育权,亟待将考试制度纳入法治范畴,而现行考试法体系存在的固有缺陷更加使得考试立法迫在眉睫。
2009年03期 v.5 35-45页 [查看摘要][在线阅读][下载 129K] [下载次数:180 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:1 ] - 王蕾;
大规模教育质量的评价在很大程度上影响着国家和地区教育发展的走向。本文以PISA2006结果报告为中心,解析PISA对大规模教育质量和相关影响因素评价的理念和方法,为研究和开展我国大规模教育质量评价提供借鉴。
2009年03期 v.5 46-59页 [查看摘要][在线阅读][下载 799K] [下载次数:583 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:1 ] - 王蕾;
大规模教育质量的评价在很大程度上影响着国家和地区教育发展的走向。本文以PISA2006结果报告为中心,解析PISA对大规模教育质量和相关影响因素评价的理念和方法,为研究和开展我国大规模教育质量评价提供借鉴。
2009年03期 v.5 46-59页 [查看摘要][在线阅读][下载 799K] [下载次数:583 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:1 ]
- 汪文义;丁树良;
本文在两参数逻辑斯蒂克模型(2PLM)下,提出一种新的选题策略——平均测验难度匹配法(Avt-b),并对四种选题策略下EAP能力估计趋势进行比较研究。通过模拟研究显示,Avt-b方法在CAT前期能够较快地锁定能力范围,较准确地作出能力估计。本文对CAT测试阶段的能力误差范围进行确定,对于多级评分模型的CAT选题策略开发具有一定的借鉴意义。
2009年03期 v.5 60-70页 [查看摘要][在线阅读][下载 289K] [下载次数:247 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:1 ] - 汪文义;丁树良;
本文在两参数逻辑斯蒂克模型(2PLM)下,提出一种新的选题策略——平均测验难度匹配法(Avt-b),并对四种选题策略下EAP能力估计趋势进行比较研究。通过模拟研究显示,Avt-b方法在CAT前期能够较快地锁定能力范围,较准确地作出能力估计。本文对CAT测试阶段的能力误差范围进行确定,对于多级评分模型的CAT选题策略开发具有一定的借鉴意义。
2009年03期 v.5 60-70页 [查看摘要][在线阅读][下载 289K] [下载次数:247 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:1 ] - 黎光明;张敏强;
为探讨全测验与锚测验不同的客观题与主观题分值比对等值误差造成的影响,本文设计两种全测验与锚测验题型分值比,以等值标准误为因变量,构建2×2的两因素完全随机化设计进行等值误差的方差分析。结果表明,全测验题型分值比与锚测验题型分值比两因素的主效应显著(p<0.001),交互作用显著(p<0.01),简单效应检验表明两因素在各水平上差异显著(p<0.01)。全测验题型分值比与锚测验题型分值比对等值误差产生一定的影响,在等值过程中应该考虑这两个影响因素,为了减小等值过程的误差,锚测验题型分值比应该尽量与全测验题型分值比相一致。
2009年03期 v.5 71-78页 [查看摘要][在线阅读][下载 129K] [下载次数:460 ] |[网刊下载次数:0 ] |[引用频次:8 ] |[阅读次数:1 ] - 黎光明;张敏强;
为探讨全测验与锚测验不同的客观题与主观题分值比对等值误差造成的影响,本文设计两种全测验与锚测验题型分值比,以等值标准误为因变量,构建2×2的两因素完全随机化设计进行等值误差的方差分析。结果表明,全测验题型分值比与锚测验题型分值比两因素的主效应显著(p<0.001),交互作用显著(p<0.01),简单效应检验表明两因素在各水平上差异显著(p<0.01)。全测验题型分值比与锚测验题型分值比对等值误差产生一定的影响,在等值过程中应该考虑这两个影响因素,为了减小等值过程的误差,锚测验题型分值比应该尽量与全测验题型分值比相一致。
2009年03期 v.5 71-78页 [查看摘要][在线阅读][下载 129K] [下载次数:460 ] |[网刊下载次数:0 ] |[引用频次:8 ] |[阅读次数:1 ] - 谢昌香;曾用强;
本文采用对比研究实验分析嵌入式评分标准对考生写作行为的影响,运用统计软件SPSS13.0进行独立样本t检验。研究结果表明,嵌入式评分标准能够加强考生对出题者意图的理解,写出符合写作要求的作文,但只对语言能力水平在一定阈值内的学生发生作用。这一结果丰富了Bachman和Palmer关于影响测试行为因素及途径的图式,也使出题者与考生的沟通更加具体直接,使写作考试更加人性化。
2009年03期 v.5 79-94页 [查看摘要][在线阅读][下载 389K] [下载次数:252 ] |[网刊下载次数:0 ] |[引用频次:3 ] |[阅读次数:1 ] - 谢昌香;曾用强;
本文采用对比研究实验分析嵌入式评分标准对考生写作行为的影响,运用统计软件SPSS13.0进行独立样本t检验。研究结果表明,嵌入式评分标准能够加强考生对出题者意图的理解,写出符合写作要求的作文,但只对语言能力水平在一定阈值内的学生发生作用。这一结果丰富了Bachman和Palmer关于影响测试行为因素及途径的图式,也使出题者与考生的沟通更加具体直接,使写作考试更加人性化。
2009年03期 v.5 79-94页 [查看摘要][在线阅读][下载 389K] [下载次数:252 ] |[网刊下载次数:0 ] |[引用频次:3 ] |[阅读次数:1 ] - 赵州魁;
近年来,成人高校招生报名人数总体呈下降趋势,是否继续现行成人高校招生制度,以及如何完善成人高校招生制度成为高等教育战线比较关注的热点问题。本文选取影响成人高校招生报名人数的几个关键因素进行实证分析,以期明晰成人高校招生制度的改革方向,也尝试为高校招生改革提供一种新的研究路径。
2009年03期 v.5 95-103页 [查看摘要][在线阅读][下载 117K] [下载次数:41 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 赵州魁;
近年来,成人高校招生报名人数总体呈下降趋势,是否继续现行成人高校招生制度,以及如何完善成人高校招生制度成为高等教育战线比较关注的热点问题。本文选取影响成人高校招生报名人数的几个关键因素进行实证分析,以期明晰成人高校招生制度的改革方向,也尝试为高校招生改革提供一种新的研究路径。
2009年03期 v.5 95-103页 [查看摘要][在线阅读][下载 117K] [下载次数:41 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]