注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

上濒

路过留下意见,共同学习提高

 
 
 

日志

 
 

第五章 心理测量学知识 第四节 测验的效度  

2014-12-18 17:38:07|  分类: 教学进行时 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 第四节   测验的效度
第一单元  效度的概念
    一、效度的定义
    在心理测扬中,效度是指所测量的与所要测量的心理特点之间的符合程度。或扎简单滴说是指一个心理测验的准确性。
    测量的效度除受随机误差影响外,还受系统误差的影响。可信的测验未必有效,而有效地测验必定可信。
    二、效度的性质
    (一)相对性
    在评鉴测验的效度时,必须考虑其目的与功能。只有所测的结果符合测验的目的,才能认为它是有效的测量工具。
    (二)连续性
    测验效度通常用相关系数表示,它只有程度上的不同。我们评价一个测验时,不应该说“有效”“无效”,而应该用效度较高或较低来评价。
   第二单元   效度的评估方法
    考察效度的方法很多,每种方法侧重的问题不同,名称也随之而异。美国心理学会在1974年发行的《教育与心理测量之标准》一书中将效度分为三大类:内容效度、构想效度和效标效度。
    一、内容效度
    (一)什么是内容效度
    内容效度指的是测验题目对有关内容或行为取样的适用性,即该测验是否是所欲测量的行为领域的代表性取样。若测验题目是行为范围的好样本,则推论将有效;若选题有偏差,则推论将无效。由于这种测验的效度主要与测验内容有关,所以称内容效度。
    (二)内容效度的评估方法
    1.专家判断法
    为了确定一个测验是否有内容效度,最常用的方法是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。如果专家认为测验题目恰当地代表了所测内容,测验就具有内容效度。内容效度有时也称为逻辑效度。
    为了使内容效度的确定过程更为客观,弥补不同专家对同一测验的判断可能出现的不一致,可采用如下三个步骤:
    (1)定义好测验内容的总体范围,描述有关的知识与技能及所用材料的来源;
    (2)编制双向细目表,确定内容和技能各自所占的比例,并有测验编制者确定个体所测的是何种内容与技能。
    (3)制定评定量表来测量测验的整个效度,如测验包括的内容、技能、材料重要程度、题目对内容的实用性等。由每位评判者在评定量表上作出判断,从而获得测验效度的证据。
    2、统计分析法
    除了描述性语言外,内容效度的确定也可采用一些统计分析的方法。例如,计算两个评分者之间评定的一致性,虽然考察的是评分者信度,但由于来自两个独立的评判者,因此符合程度越高越能反映测验的内容效度。
    3、经验推测法
    这种效度是通过实践来检验效度,如儿童发展量表是否有效,经过对不同年龄阶段的儿童进行调查,然后分析其结果,观察不同年龄阶段的儿童对每个题目的反应是否依年龄的发展而有所不同,如果通过率是随着年龄的增加而增加,就可以推测该测验有内容效度。
    (三)内容效度的特性
    内容效度经常于表面效度混淆。表面效度是由外行对测验做出表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看起来好像是测量所要测的东西,而内容效度是有够资格的判断者(专家)详尽地、系统地对测验作评价而建立的。虽然两者都是根据测验内容做出的主观判断,但判断的标准不同,前者只考虑题目与测量目的之间明显的、直接的关系,后者则考虑题目与测量目和内容总体之间逻辑上的深层关系。
    在编制测验时,表面效度是一个必须考虑的特性。例如,最高行为测验要求有较高的表面效度,以使受测者有较强的动机,尽最大努力去完成。如果测验内容看起来与测量目标不相干,就会使受测者产生马马虎虎、应付了事等反应,而影响测样的效度。相反,典型行为测验却要求较低的表面效度。如果受测者很容易从测验题目看出测验的目的,就可能产生反应偏差(如掩饰)。只有当受测者不知每个题目测量什么事,才会按自己的典型方式真实作答,否则就会按一般的要求或社会赞许的方面去回答问题,测验结果也就不是它自己真实的心理特征了。
    二、构想效度
    (一)什么是构想效度
    构想效度的概念是1954年提出来的,有人也翻译成构思效度或结构效度。它主要涉及的是心理学理论概念问题,是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
    研究和考察构想效度的宗旨是要回答下面的问题;这个测验测量什么心理构想?对这一构想测得有多好?
    (二)构想效度的估计方法
    1、对测验本身的分析
    这类方法是通过研究测验内部结构来界定理论构想,从而为构想效度提供证据。
    测验的内容效度可作为构想效度的证据。
    测验的内部一致性指标可以推断测验时测量单一特质还是测量多种特质,从而为评估测验构想效度提供证据。
    优势分析受测者对题目的反映特点也可以作为构想效度的证据。
    2、测验之间的相互比较
    通过分析几个测验间的相互关系,找出其共同之处,进而推断这些测验测量的特质是什么,也可以确定这些测验构想效度如何。
    最简单的是计算两种测验之间得分的相关,其中一个测验是待研究效度的,另一个是已有效度证据的成熟的测验,但两者测量的是同一种心里特质。假设相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。两种测验之间的相关系数称为相容效度,相容效度是构想效度的证据之一。
    区分效度是构想效度的又一证据。一个有效的测验不仅应与其他测量同一构想的测验有关,而且还必须与测量不同构想的测验无相关。换言之,测验要有效必须测量与其他标量无关的独立的构想。此种相关就是区分效度系数,相关越低,区分度越大。
    因素分析法也是建立构想效度的常用方法。通过对一组测验进行因素分析,可以找到影响测验分数的共同因素,这种因素可能就是我们要测量的心理特质(构想)
    3、效标效度的研究证明
    一个测验如果效标效度理想,那么,该测验所预测的效标的性质和种类就可以作为分析测验构想的效度指标。
    4、实验法和观察法证实
    观察实验前和实验后分数的差异也是验证构想效度的方法。根据所要测量的特质的理论构想,我们可以预测在某种情况下或经过某种训练,受测者的测验的分将会有所变化。如果预测得到证实,那就给构想效度提供了证据。
    三、效标效度
    (一)什么是效标效度
   效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测行为是检验效度的标准,简称效标。这种效度需要在实践中检验,所以又称实证效度。
    根据效标资料是否与预测分数同时获得,又可分为同时效度和预测效度两类。
    在检验一个测验效标效度时,关键在于找到合适的效标。一个好的效标必须具备如下四个条件:
    第一,效标必须能最有效地反映测验的目标,即效标测量本身必须有效。
    第二,效标必须具有较高的信度,稳定可靠,不随时间等因素而变化。
    第三,效标可以客观地加以测量,可用数据或等级来表示。
    第四,效标测量的方法简单、省时省力、经济适用。
    (二)效标效度的评估方法
    1、相关法
    相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。计算效度系数常用的是积差相关法,因为测验分数和效标资料通常都是连续标量。但在特殊情况下,也可采用其他方法。当测验成绩是连续标量,而效标资料是二分标量时,计算效度系数可用点二列相关公式或二列相关公式。点二列相关与二列相关的区别是前者其中一个是真正的二分称名变量,而后者两个变量都是连续标量,其中一个由于某种原因,被人为的分为两个类别,变成了二分称名变量。当测验分数为连续标量,效标资料为等级评定时,可用贾思鹏多列相关公式计算
    2、区分法
    区分法是检验测验分数能否有效地区分有效表所定义的团体的以后总疗法。具体做法可以分析高分组和低分组分布的重叠量。
    3、命中率法
    命中率法是当测验用来做取舍时的依据时,用其正确决定的比例作为效度指标的一种方法。使用命中率法,可将测验分数和效标资料分为两类。在测验分数方面是确定一个临界分数(即分数线),高于临界分数者预测成功,低于临界分数者预测其失败。在效标资料方面是根据实际的工作或学习成绩,确定一个合格标准,在标准之上为成功,在标准之下为失败。这样便会有四种情况:预测成功而且实际上也成功;预测成功但实际上失败;预测失败而事实上成功;预测失败且实际上也失败。我们称正确的预测(决定)为命中,不正确的预测(决定)为失误。命中率的计算有两种方法,一是计算总命中率,另一种是计算正命中率。
  失败(-) 成功(+)
 成功(+) (A)失误 (B)命中
 失败(-) (C)命中 (D)失误
   
    命中率的两种算法
    P=命中/(命中+失误)=(B+C)/(A+B+C+D)
    P=测验与效标皆成功的人数/测验成功的人数=B/(A+B)
 第三单元   效度的功能
    一、预测误差
    效度系数的实际意义常常以决定系数来表示,决定系数是效度系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。例如,测验的效度是0.80,决定系数是0.64,则测验分数正确预测效标的比例是64%,其余36%无法做出正确的预测。
    另一种表达方法是估计的标准误
    估计的标准误如同其他标准误一样解释。真正的效标分数落在预测效标正负1标准误的范围内,      
  评论这张
 
阅读(120)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016