注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

上濒

路过留下意见,共同学习提高

 
 
 

日志

 
 

第五章 测量心理学知识 第三节 测验的信度  

2014-12-18 05:27:11|  分类: 教学进行时 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

第三节   测验的信度

信度是评价一个测验是否合格的重要标志之一,也是标准化心理测验的基本要求之一。用同一个心理测验测量同一个受测者,如果今天所测得结果与明天所测得结果相差悬殊,那么,测验就不可靠。要知道一个测验是否可靠,即信度是否高,我们就要知道什么是信度、如何评估信度。哪些因素会影响信度等重要问题。

第一单元 信度的定义

一、信度的定义 

信度是指同一受测者在不同时间内用同一测验(或用另一套相同的测验)重复测量,所得结果的一致程度。如果一个测验在大致相同的情况下,几次测量的分数大体相同,便说明此测验的性能稳定、信度高;反之,几次测量的分数相差悬殊,便说明此测验的性能不稳,信度低。

信度只受随机误差的影响,随机误差越大,信度就越低。系统误差产生恒定效应,不影响信度。

(一)信度系数与信度指数

通常情况下,信度是以信度系数为指标,它是一种相关系数。常常是同一受测者样本所得的两组资料的相关。

有时也用信度系数当做信度的指标。信度指数的平方就是信度系数。

(二)测量标准误

由于存在误差,一个人所得分数有时比真分数高,有时比真分数低,有时相等。理论上 我们可以对一个人施测无数次测验,然后求得分数的平均数和标准差。在这个假设的分布里,平均数就是这个人的真分数,而标准差则未测量误差大小的指标。但由于实际上我们对同一个人不能时时无数次,所以常常用一组受测者两次测量结果来代替对同一个人的反复实测,于是有了信度另一个指标。其公式是:

SE=SX

其中,SE为测量的标准误,Sx是所得分数的标准差,rxx为测验的信度系数。从公式中可以看出,测量的标准误与信度之间有互为消长的关系;信度越高,标准误越小;信度越低,标准误越大。

第二单元   信度评估的方法

对信度的评估方法是没有通用的法则的,因为不同的信度反映测验误差的不同来源,所以每一种信度系数只能说明信度的不同方面,因而具有不同的意义。

一、重测信度

重测信度又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组受测者前后施测两次,求两次的分数间的相关系数。

最适宜的时间距离随测验的目的、性质和受测者的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。

二、复本信度

复本信度又称等值系数。它是一两个等值但题目不同的测验来测量同一群体,然后求的受测者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性,故又称等值系数。在应用上,应该有半数的受测者先做A本再做B本,另一半的受测者先做B本,然后再做A本,由此可以抵消施测顺序的效应。

如果两个复本的测验相隔一段时间,则称重测复本信度或稳定等值系数。

稳定与等值系数既考虑了测验在时间上的稳定性,又考虑了不同题目样本反应的一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。

三、内部一致性

重测信度和复本信度主要考察了测验跨时间的一致性(稳定性)和跨形式的一致性(等值性),而内部一致性信度系数主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。

(一)分半信度

分半信度只采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常在测验实施后将测验该项目符号的奇数、偶数分为等值的两半,并分别计算每位受测者在两半测验上的得分,求出两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。

(二)同质性信度

同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,其测验为同质的。相反,即使所有题目看起来好像测量统一特质,但相关很低和负相关时其测验为异质。

四、评分者信度

评分者信度适用于测量不同评分者之间所产生的误差。为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关。即得到评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上,才认为评分是客观的。

第三单元  信度与测验分数的解释

一、解释真实分数与实得分数的相关

信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异种真分数造成的变异占百分之几。例如,当rxx=0.90时,我们可以说有90%的变异是真实分数造成的,近10%是来自测验的误差。在极端情况下,如有rxx=1.00,则完全没有测量误差,所有的变异均来自真实分数;若有rxx=0,则所有的变异和差别都反映的是测量误差。应该注意的是,信度系数的分布是从0.00到1.00的正数范围,代表了从缺乏到完全可信的所有状况。

二、确定信度可以接受的水平

一个测验究竟信度多高才合适,当然,最理想的情况是rxx=1.00,但实际上是做不到的。根据多年的研究结果,一般的能力测验和成就测验的信度系数都在0.90以上,有的可以达到0.95;而人格测验、兴趣、态度、价值观等测验的信度一般在0.80——0.85或更好些。一般原则是:当rxx<0.70时,测验因不可靠而不能用;

当0.70≤rxx<0.85时,可用于团体比较;当rxx≥0.85时,才能用来鉴别或预测个人成绩或作为。另一个原则是:新编的测验信度应高于原有的同类测验或相似测验。

三、个人分数的解释

信度在解释个人分数是有意义,是通过应用测量标准误这个概念去体现的。主要体现在如下两个方面:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。

测量的标准误可以通过第一次测验的结果及信度估计得到:

SE=SX

其中,SE为测量的标准误,Sx是所得分数的标准差,rxx为测验的信度系数。

在公示中,知道了一组测量分数的标准差和信度系数,就可以求助测量的标准误。进一步我们就可以从每个人的实得分数估计出真分数的可能范围,及确定处在不同概率水平上真实分数的置信区间。人们一般采用95%的概率水平,其置信区间为:

X-1.96SE<XT≤X+1.96SE

这就是说,大约有95%的可能性真分数落在所得分数±1.96SE的范围内,或有5%的可能性落在范围之外,这实际上也表明了再测时分数改变的可能性。

假设在一个智力测验中,某个受测者的IQ分数为100,这是否反映了他的真实水平?如果再测一次他的分数将改变多少?已知该智力测验的标准差为15,信度系数为0.84,那么,其IQ的测量标准误和可能范围分别是:

SE=15=6.0

IQ=100±1.96×6.0=88~112

我们可以说这个受测者的真实分数有95%的可能性落在88与112之间。如果再测一次,他的智商低于88,高于112的可能性不超过5%。

第四单元    影响信度的因素

一、样本特征

信度常用信度系数来表示,信度系数就是相关系数,相关系数手样本是否异质及样本团体平均能力水平的影响。

(一)样本团体异质性的影响

    一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。

(二)样本团体平均能力水平的影响

二、测验长度

测验长度,也即测题的数量,也是影响信度系数的一个因素。一般来说,在一个测验中增加同质的题目,可以使信度提高。

第一,测验越长,测验的测题取样或内容取样就越有代表性。例如,为了要正确而且可靠地评估受测者的智力水平,测验必须包括很多的题目,每个题目难度不同,这样才能反映真正的智力水平,结果才可能较为可靠。

第二、测验越长,受测者的猜测因素影响就越小。

要注意的是,增加测验长度的效果应遵循报酬递减率原则,测验过长是得不偿失的,有时反而会引起受测者的疲劳和反感而降低可靠性。

三、测验难度

难度对信度的影响,只存在于某些测验中,如智力测验、成就测验、能力倾向测验等,对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题目的答案没有正确与错误之分。

四、测验间隔

时间间隔只对重测信度和不同时测量时的复本信度(重测复本信度)有影响,对其余的信度来说不存在时间间隔问题。

以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其他变因介入的可能性就越大,受外界的影响也越大,信度系数就越低。

 

  评论这张
 
阅读(217)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016