A. 分析心理與教育測量的信度主要有哪些方法(論述題)教育測量與統計的
測驗的基本要求是測驗必須穩定、准確,即要可信和有效。
一、測驗的信度(reliability):即可信程度,一致性。是反映測驗成績在不同條件下的一致性程度的指標。
影響信度的因素有四:
1.測驗的長度
2.測驗團體的同質性
3.測驗的難度
4.評分者的主觀因素
二、測驗的效度(validity):也稱有效性。是反映測量的正確性和准確性的程度的指標。
估計效度的方法:內容效度;構想效度;效標效度
影響效度的因素有三:
1.測驗的系統誤差
2.樣本的性質
3.被試的主觀狀態 予人玫瑰之手, 經久猶有餘香, 如果對你有幫助, 請點擊好評
B. 心理咨詢中簡述測量信度,效度的含義,及幾種常用評估方法
【影響信度的因素】
影響信度的因素很多,被試、主試、測驗內容、施測環境等各方面均能引起隨機誤差,導致分數不一致,從而降低測驗的信度。下面介紹幾個影響測驗信度系數的重要因素。
(一)被試的樣本
影響信度估計的一個重要因素是被試樣本的情況。
團體的異質程度與分數的分布有關,一個團體越是異質,其分數分布的范圍也就越大,信度系數也就越高。
由於信度系數與樣本團體的異質性有關,因此我們在使用測驗時,不能認為當該測驗在一個團體中有較高的信度時,在另一個團體中也具有較高的信度。此時,往往需要重新確定測量的信度。
經研究表明,信度系數不僅受樣本團體的異質程度的影響,也受樣本團體平均水平的影響。因為對於不同水平的團體,項目具有不同的難度,每個項目在難度上的變化累積起來便會影響信度。但是,這種影響不能用統計公式來推估,只能從經驗中發現。
(二)測驗的長度
一般來說,測驗越長,信度值越高。這是因為:
①測驗加長,可能改進項目取樣的代表性,從而能更好地反映受測者的真實水平;
②測驗的項目越多,在每個項目上的隨機誤差就可以互相抵消。
(三)測驗的難度
測驗的難度與信度沒有直接對應關系,但是當測驗太難或太易時,則分數的范圍就會縮小,從而降低信度。顯然只有當測驗難度水平可以使測驗分數的分布范圍最大時,測驗的信度才會最高,通常這個難度水平為0.50。
當題目過難時,被試可能憑猜測作答,從而也會降低信度。
【影響效度的因素】
影響測驗效度的因素很多,除了前面介紹的影響信度的因素以外,測驗本身、測驗的實施和被試等都會對效度產生影響。其中有些因素的影響較為普遍且明顯,有些因素的影響卻不易察覺。
(一)測驗本身
1.項目質量
測驗的指導語和試題的解答說明不明確,試題的編制不符合測量目的,試題難度不合適,試題的編排不合理,試題提供了額外線索,選擇題的答案排列具有明顯的規律性等,都會影響測驗的效度。
2.項目數量
增加測驗的長度不但能提高測驗的信度,在一定程度上也能提高測驗的效度。
(二)測驗的實施
在施測時不遵照指導語,被試作弊,測驗環境太差,評分標准不客觀,記分錯誤等等,都會影響測驗的效度。
(三)被試
1.身心狀態
被試的興趣、動機、情緒、態度、反應心向和身體狀況等都會影響被試的反應,從而影響測驗的效度。
2.樣本特點
測驗的效度和樣本團體的特點具有很大的關系。同一個測驗對於不同的樣本團體其效度有很大的不同,因此在作效度分析時,必須選具有代表性的被試團體。
樣本團體的異質性對於測驗效度是非常重要的。如果其他條件相同,樣本團體越同質,分數分布范圍越小,測驗效度就越低;樣本團體越異質,分數分布范圍越大,測驗效度就越高。
(四)效標
效標測量的可靠性以及效標和測驗分數的關系類型也會影響效度。
總之,所有與測量目的無關而又能帶來誤差的因素都會降低測驗的效度。
C. 檢驗測量的信度通常的方法有
以下是一些常見的檢驗測量信度的方法:
1. 重測法(Test-Retest Reliability):在兩個時間點,對同一樣本進行兩次測試,並計算得分之間的一致性。該方法適用於穩定的變數,例如心理學中的智力測量。
2. 內部一致性法(Internal Consistency):是指多個問題或項目衡量相同的概念時的一致性亂派。這個方法包括Cronbach's alpha系數和K-R 20等。
3. 交叉檢驗法(Cross-Validation):用一個數據集進行建模(training set),並且使用獨立的數據集對測試結果進行驗證。這個方法能夠防止過度擬合(overfitting),提高模型的泛化能咐陪粗力(generalization ability)。
4. 平行形式法(Parallel Form):使用不同衡鎮但功能類似的測試來進行比較,可以測量多項選擇題,問答題等。
5. 共同方法變異法(Common Method Variance, CMV):控制所有測量的方法相同時出現的誤差變化。
以上就是檢驗測量信度的常用方法,不同方法適用於不同類型的研究數據,具體選擇哪種方法需根據具體情況而定。
D. 心理測量學的主要方法
有些心理特徵是很難直接觀察和測量的,例如人們的動機、慾望和需要等,就需要用投射的測量方法。所謂投射法,就是讓被試通過一定的媒介,建立自己的想像世界,在無拘束的情景中,不自覺地表露出其個性特徵的研究方法。其主要方法有以下幾種:
1、聯想技術:為被試呈現一些刺激,請被試報告對這些刺激的反應,根據被試的反應作出分析,常用的有各種墨漬投射測驗,字詞聯想測驗等。
2、構成技術:被試需要根據一個或一組圖形或文字材料講述一個完整的故事。這種測驗主要測量被試的組織信息的能力,從測驗的結果分析被試的深層心理。比較著名的有:主題統覺測驗、麥克萊蘭成就測驗。還有測量人們的信念、宗教信仰、價值觀的測驗,這種技術主要側重於對被試的產出分析。
3、句子完成法:把一些沒有完成的句子呈現給被試,請被試根據自己的想法把句子完成。這種方法比較簡單,卻很能說明問題。
4、等第排序技術:請被試把一組目標、慾望、需要等按某種標准加以排序的方法。許多價值觀、成就動機、態度的測量都採用這種技術。
5、表現技術:這是一種側重過程性分析的技術,不太注重被試的產出。要求被參加一些活動,通過這些活動可以表現他們的需要、願望、情緒或動機,他們處理事物、人際交往方式無不帶有個人的獨特特徵。這些活動方式要求符合實際的生活場景,如做游戲、角色扮演、演一出戲、畫一幅畫等都可以。
6、個案分析技術:這是一種綜合性技術,既有表現的成分,又有投射的成分,個案設計得貼近實際,請被試根據文中提供的線索做出判斷和評價,被試在操作時要付出一定的努力,充分發揮自己的想像力,所以這種方法能引起被試的很大興趣。 心理測驗的產生, 是出於實際需要。最初,人們用測量,是因為要治療智力落後者和精神病病人。
法國的醫生艾斯奎羅第一個把智力落後與精神病分開。他認為,精神病以情緒障礙為標志,不一定伴隨智力落後,而智力落後則是以出生時或嬰兒期表現出來的智力缺陷為主要標志。 50多年後,法國的心理學家比內提出應該從正常學校學習的兒童中篩選出不適應的兒童,安排在特殊的班級里學習和教育。此舉動導致了心理測驗史上重大事件的發生--第一個智力測驗的誕生。
實驗心理學的誕生是心理測驗產生的另一個重要原因。實驗心理學的誕生和發展,還給心理測量帶來了另一個副產品:嚴格的標准化程序。標准化是現代心理測驗的重要評價指標。 弗蘭西斯·高爾頓(Francis Galton)是第一個倡導心理測驗的人。他於1884年在倫敦國際博覽會上專門設立了一個「人類測量實驗室」。他的這一舉動是心理測驗史上第一個大規模系統地測量個體差異的嘗試。高爾頓還是使用評定量表和問卷法的先驅。並且他發展了分析個體差異資料的統計方法,不僅擴充了古特列特的百分位法,而且創造了粗淺的相關計演算法。
在心理測驗的發展史上,美國心理學家卡特爾 (J.M.Cattell)占據了一個特別重要的位置。卡特爾早年留學與德國,師從馮特(W.Wundt)。1888年,在英國劍橋大學任教期間,與高爾頓往來甚密,深受其影響。他於1890年發表的《心理測驗與測量》一文,首創了「心理測驗」這個術語。
著名美國學者波林(E.G.Boring)指出:「在測驗理領域中,19世紀80年代是高爾頓的十年,90年代是卡特爾的十年,20世紀頭十年是比內(A.Binet)的十年。」
1904年比內為了鑒別弱智兒童,他與其助手西蒙(T.Simon)合作編製成了世界上第一個科學的智力測驗--比內-西蒙量表。1905年,他在《心理學年報》上發表了文章《診斷異常兒童的新方法》,介紹了該量表,歷史上稱為「1905量表」。從此,比內-西蒙量表宣告誕生。比內-西蒙量表自1905年發表後,比內和西蒙親自主持過兩次修訂,一次在1908年,一次在1911年(就在這一年比內不幸去世)。1905年量表主要強調的是判斷、理解和推理能力,也就是比內認為的智力的基本組成成分。1908年版的量表刪掉了1905年版中不合適的題目,增加了新題目,題目總數大59個。所有測驗題目按年齡分組,從3 ~ 13歲。測驗的結果用「智力水平」來表示。人們常叫它為「智力年齡」 。它表示一個兒童能完成何種年齡水平的兒童所能完成的測驗。 比內-西蒙量表問世後,迅速傳至世界各地。各語言版本紛紛出現,其中最著名的是1918年出版的美國斯坦福大學的推孟(L.M.Terman)教授1916年修訂的「斯坦福-比內量表」。這一量表首次使用了「智力商數」的概念,簡稱為IQ,是心理年齡和實際年齡的比值。從此「智商」一詞便為全世界所熟悉。
心理測驗運動自本世紀初興起,20年代進入狂熱,40年代達到頂峰,50年代後轉向穩步發展。在此期間測驗主要有以下幾方面的發展。
1、編制出一批操作測驗,既可彌補語言文字量表在理論上的缺陷,又可適用於文盲和有言語障礙的人。
2、編制出團體智力測驗,擴大了測驗的應用范圍。
3、多重能力傾向測驗逐漸受到重視。
4、卡特爾的學生桑代克(E.L.Thorndike)等人,利用心理測驗原理,編制了第一批標准化的教育測驗。因此後人尊稱他為教育測驗之鼻祖。
5、心理測驗發展的另一領域涉及情感適應、人際關系、動機、興趣、態度、性格等人格特點的測量。
6、60年代後,由於認知心理學的崛起,將實驗法與測驗法結合,產生了信息加工測驗,為了解心理能力提供了一些補充方法,使心理測驗出現了新的發展趨勢。 1、中國古代心理測量簡述
(1) 公元六世紀初,南朝人劉勰的著作《新論·專學》中提到了類似現代「分心測驗」的思想。(2) 在中國古代,「七巧板」是很常見的一種兒童玩具,其實它可以作為創造力測量的工具。
(3) 中國古代心理測量的思想中包含著典型的東方文化特點:定性描述及帶有道德判斷色彩。
中國近代心理測量的出現
(1) 1916年,樊炳清先生首先介紹了比內-西蒙智力量表。
(2) 1920年,北京高等師范學校和南京師范學校建立了我國最早的兩個心理學實驗室,廖世承和陳鶴琴先生在南京高等師范學校開設心理測驗課。1921年,他倆正式出版《心理測驗法》一書。
(3)1922年夏天,中華教育改進社聘請美國教育心理測驗專家麥考爾來華講學。
(4)1924年,陸志韋先生發表了《訂正比內西蒙智力測驗說明書》,30年代又與吳天敏再次做了修訂。
(5)1931年由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議,組織並成立了中國測驗學會。
(6)1932年《測驗》雜志創刊。
(7)至抗戰前夕,由我國心理學工作者制定或編制出的合乎標準的智力測驗和人格測驗約20種,教育測驗50多種。
中國現代心理測量的發展
(1) 1936年,蘇聯在批判「兒童學」時擴大化,心理測驗也被一概禁止。
(2) 從1978年北京大學首建心理系開始,心理測驗才重新得到恢復。
(3) 1979年,林傳鼎、張厚等以國外資料為參考,編制了少年兒童學習能力測驗。
(4)1980年初,北師大心理系開設了心理測量課。1984年,在北京召開的第五屆全國心理學年會上,成立了心理測驗工作委員會,加強了測驗工作的指導和監督。
E. 什麼是心理測試的信度和效度
1、信度:一般通過使用同一量表進行不同測量,分析各測量結果之間聯系的方法來評價信度。如果聯系密切,各測量結果具有一致性,則認為量表是可信的。評介信度的方法主要鎮岩兆有:再預測量、替換形式、內部一致性方法。
2、效度是測量的有效性程度,即測量工具確能測出其所要測量特質的程度,或者棗衡簡單地說是指一個測御租驗的准確性、有用性。效度是科學的測量工具所必須具備的最重要的條件。在社會測量中,對作為測量工具的問卷或量表的效度要求較高。鑒別效度須明確測量的目的與范圍,考慮所要測量的內容並分析其性質與特徵,檢查測量的內容是否與測量的目的相符,進而判斷測量結果是否反映了所要測量的特質的程度。
3、信度高,效度不一定高,效度高,信度一定高
F. 評定測量信度的方法有哪些
(1)重測信度(test-retest
reliabilty)同一組受評者在兩次不同時間作同一套量表評定,對兩次結果作相關性檢驗,以估計量表結果的穩定性。
(2)分半信度(split-half
reliability)將一套量表的各項目按奇、偶數號分成兩半,對其評定結果進行相關性檢驗。由於分半信度檢驗最好要求量表項目按難度排列,而大多數評定量表均非如此,故其使用有限。
(3)同質性信度(inter-item
consistency)所謂同質性信度是指評定量表內部所有項目間的一致性,這里講的是分數的一致,而不是項目內容或形式的一致。量表內各項目分數相關越高,則量表項目就越同質。最常用的檢驗同質性信度方法為庫德一理查遜公式(KuderRichardson
formula
20,K-R20),但K-R20公式只適用於二分法計分題量表,而對多重記分法量表則常用克倫巴赫α系數(Cronbach'
s
S
α
Coefficicient)估計。另外,分半相關法也是估計同質性信度的一種方法。
(4)評定者信度(inter-rater
reliability)數名不同評定者採用同一套量表對相同受評者進行評定,對所得結果進行一致性檢驗,以估計評定量表評分客觀性。對心理測驗而言,一般都採用客觀性項目,且有一套相當標准化的評分程序,因此由評分引起的誤差變異是可以忽略的。而評定量表相當多的是主觀項目,且評定者在評分時或多或少摻雜主觀判斷成分,故評定者之間的評分誤差變異難以避免。一般要求在成對的受過訓練的評定者之間平均相關系數達到0.
9以上,才認為評分是客觀的。
其它尚有正復本相關、因素信度、測量標准誤等信度檢驗方法,此處從略。
G. 如何提高心理測驗的信度和效度
提高信度的方法:1.適當增加測驗長度2.使測驗中所有的試題的難度接近正態分布,並控制在中等水平3.努力提高測驗試題的區分度4.選取恰當的被試,提高測驗在各同質性較強的亞團體上的信度5.主試者嚴格執行測驗規程,評分者嚴格標准評分,實測場地按測驗手冊的要求布置,減少無關因素的干擾。提高效度的方法:1.精心編制測驗量表,避免出現較大的系統誤差2.妥善組織測驗,控制隨機誤差3.創設標準的應試情境,讓每個被試都發揮出正常水平4.選好正確的效標,定好恰當的效標測量,正確使用有關公式
H. 心理測量中有哪幾種信度指標
根據信都的理論定義,(1)信度是一個被測團體的真分數的變異數與實得分數的變異數之比
(2)信度是一個被試團體的真分數與實得分數的相關系數的平方
(3)信度是一個測驗與其任意一個平行測驗的相關系數
(4)信度指數,也就是信度系數的平方根
前兩種定義由於真分數在實際測量中難以測量,所以前兩種的信度系數難以獲得。
信度系數的估計有5種方法,分別是①計算重測信度(同一組被試在兩次相同測驗中所得分數的皮爾遜積差相關)
②復本信度(兩個平行測驗所得分數的皮爾遜積差相關)
③分半信度(與復本信度類似哪帆塵,但是是計算在兩半測驗的分數的相關後,再用斯皮爾曼--布朗公式或者弗朗那根公式或者盧綸公式加以校正。前一個公式與後兩個公式試用條件不同)
④同轎逗質性信度=內部一致性系數(常用克隆巴赫爾α系數李禪公式計算或者荷伊特信度計算)
⑤評分者信度(評分者只有兩個人時用積差相關或等級相關,多於兩人時,用肯德爾和諧系數)
I. 什麼是心理測量的信度,其統計定義你學過哪幾個實際計算信度的方法你學過幾種
信度是指心理測驗的可靠性,在經典測量理論中,其統計定義有三個:
測量學上,信度被定義為:一組測量分數的真分數變異與實得變異的比率。
除此之外,信度還有兩個等價的操作定義:
1、信度是一個被試團體的真分數與觀察分數相關系數的平方。
2、信度是指一個測驗與其任意一個平行測驗的相關系數。
信度的計算方法有五種
1、復本信度:即一組被試在兩個平行測驗上得分的一致性程度。
計算方法:其值為兩個平行測驗分數之間的皮爾遜相關系數。
2、再測信度:用同一量表對同一組被試實測兩次所得結果的一致性程度。
計算:與復本信度的計算相同。
3、分半信度:把測驗的全部項目分成兩部分,所以被試在這兩部分上得分的一致性程度。
計算:斯皮爾曼布朗公式、弗朗那根公式、盧綸公式。
4、同質性信度:指測量內部所以題目的一致性程度。
計算:克倫巴赫系數
5、評分者信度:多個評分者對同一組被試的測驗結果進行評分的一致性程度。
計算:肯德而和諧系數
具體公式見戴海琦《心理測量》
J. 心理學的自編問卷如何測信效度
測試信度(test reliability)也叫測試的可靠性,指的是測試結果是否穩定可靠。也就是說,測試的成績是不是反映了受試者的實際語言水平。例如,如果同一套測試在對同一測試對象(即受試者本身沒有變化)進行的數次測試中,受試者的分數忽高忽低的話,則說明該測試缺乏信度。測試的信度與測試的效度有著密切的關系。一般說來,只有信度較高的測試才能有較高的效度,但效度較高不能保證信度也一定較高。測試的信度主要涉及到試題本身的可靠性和評分的可靠性這兩個方面。試碧絕爛題本身是否可靠主要取決於試題的范圍、數量、試題的區分度等因素;評分是否可靠則要看評分標準是否客觀和准確。 測試的信度通常用一種相關系數(即兩個數之間的比例關系)來表示,相關系數越大,信度則越高。悔漏當系數為1.00時,說明測試的可靠性達到最高程度;而系數是0.00時,則測試的可靠性降到最低程度。在一般情況下,系數不會高到1.00,也不會降到0.00,而是在兩者之間。對信度指數的要求因測試類別的不同而不同,人們通常對標准化測試的信度系數要求在0.90以上,例如「托福」的信度大致為0.95,而課堂測試的信度系數則以0.70-0.80之間為可接受性系數。測試信度的計算方法有很多種,以下僅介紹三種易於操作的方法: 1)重測法(the retesting method)。用同一套試卷在兩個不同時間內來測試同一批受試者,這樣便獲得兩組分數,然後計算出兩組分數的相關系數。當然,在兩次測試中,學生第二次的測試成績理應比第一次的要高,因為在第二次測試時學生已經有了進步而且臨場經驗也更豐富了。但是若該試題是比較可靠的,每個學生在兩次測試中的排名次序應該是基本不變的。 2)交替形式法(the alternative method)。對同一批受試者使用試題類型完全相同,難易程度相當,但具體題目不同的兩套對等試卷先後進行兩次測試,然後計算出兩次得分的相關系數。 3)對半法(the split-half method)。測試只進行一次,但將整份試卷的題目按單、雙數分成兩組來分別計分,算出兩組分數的相關系數,然後再用Spearman-Brown的公式計算整份試卷的信度系數。具體計算步驟是:將兩組分數的相關系數乘以宏扒2,再除以1加兩組分數的相關系數。 http://ke..com/view/698674.htm