测试的可靠性,通常通过衡量两个分数之间的相关系数来体现,这个系数越大,测试的信度也就越高。当相关系数达到1.00时,代表测试的绝对可靠;而系数为0.00,则意味着极低的信度。在实际应用中,相关系数通常介于两者之间,具有一定的范围。对于标准化测试,如托福,其信度标准通常要求在0.90以上,例如托福的信度大约为0.95。课堂测试的信度要求则相对较低,一般在0.70到0.80之间被视为可接受。
评估信度的方法有很多种,这里介绍三种常用的:重测法,即在两个不同时间点使用同一份试卷对同一群人进行测试,计算两次得分的相关系数。尽管第二次测试由于学习进步和经验增加,得分可能提高,但测试的可靠度体现在受试者排名的稳定性上,如果试题可靠,排名应大致不变。
交替形式法,是使用两套题目类型相同但具体题目不同的试卷,对同一组人进行两次测试,计算两次得分的相关系数。这种方法旨在考察测试内容的稳定性。
最后,对半法,即只做一次测试,但将试卷分为两半,分别计分,然后通过Spearman-Brown公式计算信度。具体步骤是:将两组分数的相关系数乘以2,再除以1加上这两组系数的总和。