A. 分析心理与教育测量的信度主要有哪些方法(论述题)教育测量与统计的
测验的基本要求是测验必须稳定、准确,即要可信和有效。
一、测验的信度(reliability):即可信程度,一致性。是反映测验成绩在不同条件下的一致性程度的指标。
影响信度的因素有四:
1.测验的长度
2.测验团体的同质性
3.测验的难度
4.评分者的主观因素
二、测验的效度(validity):也称有效性。是反映测量的正确性和准确性的程度的指标。
估计效度的方法:内容效度;构想效度;效标效度
影响效度的因素有三:
1.测验的系统误差
2.样本的性质
3.被试的主观状态 予人玫瑰之手, 经久犹有余香, 如果对你有帮助, 请点击好评
B. 心理咨询中简述测量信度,效度的含义,及几种常用评估方法
【影响信度的因素】
影响信度的因素很多,被试、主试、测验内容、施测环境等各方面均能引起随机误差,导致分数不一致,从而降低测验的信度。下面介绍几个影响测验信度系数的重要因素。
(一)被试的样本
影响信度估计的一个重要因素是被试样本的情况。
团体的异质程度与分数的分布有关,一个团体越是异质,其分数分布的范围也就越大,信度系数也就越高。
由于信度系数与样本团体的异质性有关,因此我们在使用测验时,不能认为当该测验在一个团体中有较高的信度时,在另一个团体中也具有较高的信度。此时,往往需要重新确定测量的信度。
经研究表明,信度系数不仅受样本团体的异质程度的影响,也受样本团体平均水平的影响。因为对于不同水平的团体,项目具有不同的难度,每个项目在难度上的变化累积起来便会影响信度。但是,这种影响不能用统计公式来推估,只能从经验中发现。
(二)测验的长度
一般来说,测验越长,信度值越高。这是因为:
①测验加长,可能改进项目取样的代表性,从而能更好地反映受测者的真实水平;
②测验的项目越多,在每个项目上的随机误差就可以互相抵消。
(三)测验的难度
测验的难度与信度没有直接对应关系,但是当测验太难或太易时,则分数的范围就会缩小,从而降低信度。显然只有当测验难度水平可以使测验分数的分布范围最大时,测验的信度才会最高,通常这个难度水平为0.50。
当题目过难时,被试可能凭猜测作答,从而也会降低信度。
【影响效度的因素】
影响测验效度的因素很多,除了前面介绍的影响信度的因素以外,测验本身、测验的实施和被试等都会对效度产生影响。其中有些因素的影响较为普遍且明显,有些因素的影响却不易察觉。
(一)测验本身
1.项目质量
测验的指导语和试题的解答说明不明确,试题的编制不符合测量目的,试题难度不合适,试题的编排不合理,试题提供了额外线索,选择题的答案排列具有明显的规律性等,都会影响测验的效度。
2.项目数量
增加测验的长度不但能提高测验的信度,在一定程度上也能提高测验的效度。
(二)测验的实施
在施测时不遵照指导语,被试作弊,测验环境太差,评分标准不客观,记分错误等等,都会影响测验的效度。
(三)被试
1.身心状态
被试的兴趣、动机、情绪、态度、反应心向和身体状况等都会影响被试的反应,从而影响测验的效度。
2.样本特点
测验的效度和样本团体的特点具有很大的关系。同一个测验对于不同的样本团体其效度有很大的不同,因此在作效度分析时,必须选具有代表性的被试团体。
样本团体的异质性对于测验效度是非常重要的。如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低;样本团体越异质,分数分布范围越大,测验效度就越高。
(四)效标
效标测量的可靠性以及效标和测验分数的关系类型也会影响效度。
总之,所有与测量目的无关而又能带来误差的因素都会降低测验的效度。
C. 检验测量的信度通常的方法有
以下是一些常见的检验测量信度的方法:
1. 重测法(Test-Retest Reliability):在两个时间点,对同一样本进行两次测试,并计算得分之间的一致性。该方法适用于稳定的变量,例如心理学中的智力测量。
2. 内部一致性法(Internal Consistency):是指多个问题或项目衡量相同的概念时的一致性乱派。这个方法包括Cronbach's alpha系数和K-R 20等。
3. 交叉检验法(Cross-Validation):用一个数据集进行建模(training set),并且使用独立的数据集对测试结果进行验证。这个方法能够防止过度拟合(overfitting),提高模型的泛化能咐陪粗力(generalization ability)。
4. 平行形式法(Parallel Form):使用不同衡镇但功能类似的测试来进行比较,可以测量多项选择题,问答题等。
5. 共同方法变异法(Common Method Variance, CMV):控制所有测量的方法相同时出现的误差变化。
以上就是检验测量信度的常用方法,不同方法适用于不同类型的研究数据,具体选择哪种方法需根据具体情况而定。
D. 心理测量学的主要方法
有些心理特征是很难直接观察和测量的,例如人们的动机、欲望和需要等,就需要用投射的测量方法。所谓投射法,就是让被试通过一定的媒介,建立自己的想象世界,在无拘束的情景中,不自觉地表露出其个性特征的研究方法。其主要方法有以下几种:
1、联想技术:为被试呈现一些刺激,请被试报告对这些刺激的反应,根据被试的反应作出分析,常用的有各种墨渍投射测验,字词联想测验等。
2、构成技术:被试需要根据一个或一组图形或文字材料讲述一个完整的故事。这种测验主要测量被试的组织信息的能力,从测验的结果分析被试的深层心理。比较着名的有:主题统觉测验、麦克莱兰成就测验。还有测量人们的信念、宗教信仰、价值观的测验,这种技术主要侧重于对被试的产出分析。
3、句子完成法:把一些没有完成的句子呈现给被试,请被试根据自己的想法把句子完成。这种方法比较简单,却很能说明问题。
4、等第排序技术:请被试把一组目标、欲望、需要等按某种标准加以排序的方法。许多价值观、成就动机、态度的测量都采用这种技术。
5、表现技术:这是一种侧重过程性分析的技术,不太注重被试的产出。要求被参加一些活动,通过这些活动可以表现他们的需要、愿望、情绪或动机,他们处理事物、人际交往方式无不带有个人的独特特征。这些活动方式要求符合实际的生活场景,如做游戏、角色扮演、演一出戏、画一幅画等都可以。
6、个案分析技术:这是一种综合性技术,既有表现的成分,又有投射的成分,个案设计得贴近实际,请被试根据文中提供的线索做出判断和评价,被试在操作时要付出一定的努力,充分发挥自己的想象力,所以这种方法能引起被试的很大兴趣。 心理测验的产生, 是出于实际需要。最初,人们用测量,是因为要治疗智力落后者和精神病病人。
法国的医生艾斯奎罗第一个把智力落后与精神病分开。他认为,精神病以情绪障碍为标志,不一定伴随智力落后,而智力落后则是以出生时或婴儿期表现出来的智力缺陷为主要标志。 50多年后,法国的心理学家比内提出应该从正常学校学习的儿童中筛选出不适应的儿童,安排在特殊的班级里学习和教育。此举动导致了心理测验史上重大事件的发生--第一个智力测验的诞生。
实验心理学的诞生是心理测验产生的另一个重要原因。实验心理学的诞生和发展,还给心理测量带来了另一个副产品:严格的标准化程序。标准化是现代心理测验的重要评价指标。 弗兰西斯·高尔顿(Francis Galton)是第一个倡导心理测验的人。他于1884年在伦敦国际博览会上专门设立了一个“人类测量实验室”。他的这一举动是心理测验史上第一个大规模系统地测量个体差异的尝试。高尔顿还是使用评定量表和问卷法的先驱。并且他发展了分析个体差异资料的统计方法,不仅扩充了古特列特的百分位法,而且创造了粗浅的相关计算法。
在心理测验的发展史上,美国心理学家卡特尔 (J.M.Cattell)占据了一个特别重要的位置。卡特尔早年留学与德国,师从冯特(W.Wundt)。1888年,在英国剑桥大学任教期间,与高尔顿往来甚密,深受其影响。他于1890年发表的《心理测验与测量》一文,首创了“心理测验”这个术语。
着名美国学者波林(E.G.Boring)指出:“在测验理领域中,19世纪80年代是高尔顿的十年,90年代是卡特尔的十年,20世纪头十年是比内(A.Binet)的十年。”
1904年比内为了鉴别弱智儿童,他与其助手西蒙(T.Simon)合作编制成了世界上第一个科学的智力测验--比内-西蒙量表。1905年,他在《心理学年报》上发表了文章《诊断异常儿童的新方法》,介绍了该量表,历史上称为“1905量表”。从此,比内-西蒙量表宣告诞生。比内-西蒙量表自1905年发表后,比内和西蒙亲自主持过两次修订,一次在1908年,一次在1911年(就在这一年比内不幸去世)。1905年量表主要强调的是判断、理解和推理能力,也就是比内认为的智力的基本组成成分。1908年版的量表删掉了1905年版中不合适的题目,增加了新题目,题目总数大59个。所有测验题目按年龄分组,从3 ~ 13岁。测验的结果用“智力水平”来表示。人们常叫它为“智力年龄” 。它表示一个儿童能完成何种年龄水平的儿童所能完成的测验。 比内-西蒙量表问世后,迅速传至世界各地。各语言版本纷纷出现,其中最着名的是1918年出版的美国斯坦福大学的推孟(L.M.Terman)教授1916年修订的“斯坦福-比内量表”。这一量表首次使用了“智力商数”的概念,简称为IQ,是心理年龄和实际年龄的比值。从此“智商”一词便为全世界所熟悉。
心理测验运动自本世纪初兴起,20年代进入狂热,40年代达到顶峰,50年代后转向稳步发展。在此期间测验主要有以下几方面的发展。
1、编制出一批操作测验,既可弥补语言文字量表在理论上的缺陷,又可适用于文盲和有言语障碍的人。
2、编制出团体智力测验,扩大了测验的应用范围。
3、多重能力倾向测验逐渐受到重视。
4、卡特尔的学生桑代克(E.L.Thorndike)等人,利用心理测验原理,编制了第一批标准化的教育测验。因此后人尊称他为教育测验之鼻祖。
5、心理测验发展的另一领域涉及情感适应、人际关系、动机、兴趣、态度、性格等人格特点的测量。
6、60年代后,由于认知心理学的崛起,将实验法与测验法结合,产生了信息加工测验,为了解心理能力提供了一些补充方法,使心理测验出现了新的发展趋势。 1、中国古代心理测量简述
(1) 公元六世纪初,南朝人刘勰的着作《新论·专学》中提到了类似现代“分心测验”的思想。(2) 在中国古代,“七巧板”是很常见的一种儿童玩具,其实它可以作为创造力测量的工具。
(3) 中国古代心理测量的思想中包含着典型的东方文化特点:定性描述及带有道德判断色彩。
中国近代心理测量的出现
(1) 1916年,樊炳清先生首先介绍了比内-西蒙智力量表。
(2) 1920年,北京高等师范学校和南京师范学校建立了我国最早的两个心理学实验室,廖世承和陈鹤琴先生在南京高等师范学校开设心理测验课。1921年,他俩正式出版《心理测验法》一书。
(3)1922年夏天,中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
(4)1924年,陆志韦先生发表了《订正比内西蒙智力测验说明书》,30年代又与吴天敏再次做了修订。
(5)1931年由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会。
(6)1932年《测验》杂志创刊。
(7)至抗战前夕,由我国心理学工作者制定或编制出的合乎标准的智力测验和人格测验约20种,教育测验50多种。
中国现代心理测量的发展
(1) 1936年,苏联在批判“儿童学”时扩大化,心理测验也被一概禁止。
(2) 从1978年北京大学首建心理系开始,心理测验才重新得到恢复。
(3) 1979年,林传鼎、张厚等以国外资料为参考,编制了少年儿童学习能力测验。
(4)1980年初,北师大心理系开设了心理测量课。1984年,在北京召开的第五届全国心理学年会上,成立了心理测验工作委员会,加强了测验工作的指导和监督。
E. 什么是心理测试的信度和效度
1、信度:一般通过使用同一量表进行不同测量,分析各测量结果之间联系的方法来评价信度。如果联系密切,各测量结果具有一致性,则认为量表是可信的。评介信度的方法主要镇岩兆有:再预测量、替换形式、内部一致性方法。
2、效度是测量的有效性程度,即测量工具确能测出其所要测量特质的程度,或者枣衡简单地说是指一个测御租验的准确性、有用性。效度是科学的测量工具所必须具备的最重要的条件。在社会测量中,对作为测量工具的问卷或量表的效度要求较高。鉴别效度须明确测量的目的与范围,考虑所要测量的内容并分析其性质与特征,检查测量的内容是否与测量的目的相符,进而判断测量结果是否反映了所要测量的特质的程度。
3、信度高,效度不一定高,效度高,信度一定高
F. 评定测量信度的方法有哪些
(1)重测信度(test-retest
reliabilty)同一组受评者在两次不同时间作同一套量表评定,对两次结果作相关性检验,以估计量表结果的稳定性。
(2)分半信度(split-half
reliability)将一套量表的各项目按奇、偶数号分成两半,对其评定结果进行相关性检验。由于分半信度检验最好要求量表项目按难度排列,而大多数评定量表均非如此,故其使用有限。
(3)同质性信度(inter-item
consistency)所谓同质性信度是指评定量表内部所有项目间的一致性,这里讲的是分数的一致,而不是项目内容或形式的一致。量表内各项目分数相关越高,则量表项目就越同质。最常用的检验同质性信度方法为库德一理查逊公式(KuderRichardson
formula
20,K-R20),但K-R20公式只适用于二分法计分题量表,而对多重记分法量表则常用克伦巴赫α系数(Cronbach'
s
S
α
Coefficicient)估计。另外,分半相关法也是估计同质性信度的一种方法。
(4)评定者信度(inter-rater
reliability)数名不同评定者采用同一套量表对相同受评者进行评定,对所得结果进行一致性检验,以估计评定量表评分客观性。对心理测验而言,一般都采用客观性项目,且有一套相当标准化的评分程序,因此由评分引起的误差变异是可以忽略的。而评定量表相当多的是主观项目,且评定者在评分时或多或少掺杂主观判断成分,故评定者之间的评分误差变异难以避免。一般要求在成对的受过训练的评定者之间平均相关系数达到0.
9以上,才认为评分是客观的。
其它尚有正复本相关、因素信度、测量标准误等信度检验方法,此处从略。
G. 如何提高心理测验的信度和效度
提高信度的方法:1.适当增加测验长度2.使测验中所有的试题的难度接近正态分布,并控制在中等水平3.努力提高测验试题的区分度4.选取恰当的被试,提高测验在各同质性较强的亚团体上的信度5.主试者严格执行测验规程,评分者严格标准评分,实测场地按测验手册的要求布置,减少无关因素的干扰。提高效度的方法:1.精心编制测验量表,避免出现较大的系统误差2.妥善组织测验,控制随机误差3.创设标准的应试情境,让每个被试都发挥出正常水平4.选好正确的效标,定好恰当的效标测量,正确使用有关公式
H. 心理测量中有哪几种信度指标
根据信都的理论定义,(1)信度是一个被测团体的真分数的变异数与实得分数的变异数之比
(2)信度是一个被试团体的真分数与实得分数的相关系数的平方
(3)信度是一个测验与其任意一个平行测验的相关系数
(4)信度指数,也就是信度系数的平方根
前两种定义由于真分数在实际测量中难以测量,所以前两种的信度系数难以获得。
信度系数的估计有5种方法,分别是①计算重测信度(同一组被试在两次相同测验中所得分数的皮尔逊积差相关)
②复本信度(两个平行测验所得分数的皮尔逊积差相关)
③分半信度(与复本信度类似哪帆尘,但是是计算在两半测验的分数的相关后,再用斯皮尔曼--布朗公式或者弗朗那根公式或者卢纶公式加以校正。前一个公式与后两个公式试用条件不同)
④同轿逗质性信度=内部一致性系数(常用克隆巴赫尔α系数李禅公式计算或者荷伊特信度计算)
⑤评分者信度(评分者只有两个人时用积差相关或等级相关,多于两人时,用肯德尔和谐系数)
I. 什么是心理测量的信度,其统计定义你学过哪几个实际计算信度的方法你学过几种
信度是指心理测验的可靠性,在经典测量理论中,其统计定义有三个:
测量学上,信度被定义为:一组测量分数的真分数变异与实得变异的比率。
除此之外,信度还有两个等价的操作定义:
1、信度是一个被试团体的真分数与观察分数相关系数的平方。
2、信度是指一个测验与其任意一个平行测验的相关系数。
信度的计算方法有五种
1、复本信度:即一组被试在两个平行测验上得分的一致性程度。
计算方法:其值为两个平行测验分数之间的皮尔逊相关系数。
2、再测信度:用同一量表对同一组被试实测两次所得结果的一致性程度。
计算:与复本信度的计算相同。
3、分半信度:把测验的全部项目分成两部分,所以被试在这两部分上得分的一致性程度。
计算:斯皮尔曼布朗公式、弗朗那根公式、卢纶公式。
4、同质性信度:指测量内部所以题目的一致性程度。
计算:克伦巴赫系数
5、评分者信度:多个评分者对同一组被试的测验结果进行评分的一致性程度。
计算:肯德而和谐系数
具体公式见戴海琦《心理测量》
J. 心理学的自编问卷如何测信效度
测试信度(test reliability)也叫测试的可靠性,指的是测试结果是否稳定可靠。也就是说,测试的成绩是不是反映了受试者的实际语言水平。例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。测试的信度与测试的效度有着密切的关系。一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。试碧绝烂题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。 测试的信度通常用一种相关系数(即两个数之间的比例关系)来表示,相关系数越大,信度则越高。悔漏当系数为1.00时,说明测试的可靠性达到最高程度;而系数是0.00时,则测试的可靠性降到最低程度。在一般情况下,系数不会高到1.00,也不会降到0.00,而是在两者之间。对信度指数的要求因测试类别的不同而不同,人们通常对标准化测试的信度系数要求在0.90以上,例如“托福”的信度大致为0.95,而课堂测试的信度系数则以0.70-0.80之间为可接受性系数。测试信度的计算方法有很多种,以下仅介绍三种易于操作的方法: 1)重测法(the retesting method)。用同一套试卷在两个不同时间内来测试同一批受试者,这样便获得两组分数,然后计算出两组分数的相关系数。当然,在两次测试中,学生第二次的测试成绩理应比第一次的要高,因为在第二次测试时学生已经有了进步而且临场经验也更丰富了。但是若该试题是比较可靠的,每个学生在两次测试中的排名次序应该是基本不变的。 2)交替形式法(the alternative method)。对同一批受试者使用试题类型完全相同,难易程度相当,但具体题目不同的两套对等试卷先后进行两次测试,然后计算出两次得分的相关系数。 3)对半法(the split-half method)。测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,算出两组分数的相关系数,然后再用Spearman-Brown的公式计算整份试卷的信度系数。具体计算步骤是:将两组分数的相关系数乘以宏扒2,再除以1加两组分数的相关系数。 http://ke..com/view/698674.htm