信度是指測驗結果的一致性、穩定性及可靠性,一般多以內部一致性來加以表示該測驗信度的高低。信度系數愈高即表示該測驗的結果愈一致、穩定與可靠。系統誤差對信度沒什麼影響,因為系統誤差總是以相同的方式影響測量值的,因此不會造成不一致性。反之,隨機誤差可能導致不一致性,從而降低信度。
效度(Validity)即有效性,它是指測量工具或手段能夠准確測出所需測量的事物的程度。效度是指所測量到的結果反映所想要考察內容的程度,測量結果與要考察的內容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:內容效度、准則效度和結構效度。
提高測驗信度的方法 :
( 1 )適當延長測驗的長度 :
測驗的長度主要指量表所包含的題目多少。對一個測驗來說 , 測驗的題目越少 , 得分越容易受偶然因素的影響 , 故測驗的信度越低。 反之如果測驗題目較多 , 即測驗長度延長 , 擴大了被試得分范圍 , 可在一定程度上排除偶然因素的影響 , 從而提高測驗信度。但是測驗信度的增加並不是等比例提高信度系數。當信度系數較小時 , 延長測驗長度信度系數增加較大 ; 當信度系數已經較大時 , 延長測驗長度對信度系數的影響就較小了。而且 , 在延長測驗長度時 , 還需考慮其他因素的影響 , 如被試在回答問題時是否疲倦或產生厭煩情緒 , 是否節省時間、物力和財力 , 測題是否附合測驗目的等。
( 2 )測驗的難度要適中 : 難度即測驗的難易程度 , 當測驗難度太大時 , 被試得分普遍太低 , 呈負偏態分布 ; 當測驗難度太小時 , 被試得分普遍較高 , 呈正偏態分布。太難太易的測驗都使被試得分差異減小 , 使實得分數方差減小 , 從而降低測驗信度。
( 3 )測驗的內容盡量同質 : 性質相同的測驗內容 , 對被試也要求相同的能力、知識和技能 ; 而內容不同質的測驗 , 則要求被試不同的能力、 知識和技能。因而為了提高測驗信度 , 測驗內容應盡量同質。
( 4 )測驗的時間要充分 : 對某一測驗而言 , 應保證絕大多數被試在規定時間內完成測驗 ; 否則 , 如果被試不能從容回答所有問題 , 就不能反映被試的真實水平。
( 5 )測驗的程序要統一 : 包括測驗的題目統一 , 指導語、 回答問題的方式、分收試卷的方法、測驗時間等都要統一。
( 6 )評分要客觀 : 評分是否客觀對測驗信度有直接的影響。對於客觀性題目 , 評分標准明確 , 評分容易做到客觀 ; 但對於主觀性題目 , 受評分者影響較大 , 不易做到客觀。為了盡可能客觀評分 , 應制定明確而易掌握的評分標准 , 盡量做到一卷多評 , 或一人只評一題等。
提高測驗效度的方法 :
( 2 )控制系統誤差 : 系統誤差是影響測驗效度的主要因素。它主要包括儀器不準 , 題目和指導語有暗示性 , 答案按排不當 ( 被試可以猜測 ) 等 , 控制這些因素可以降低系統誤差 , 提高效度。
(2) 精心編制測題和測驗量表 : 首先測題內容要適合測驗目的 , 如知識性測題就不能全面反映被試的智力水平 , 它主要測量其知識水平。其次 , 測題要清楚明了 , 用語要讓被試理解 , 排列由易到難。第三 , 測題的難度和曲分度要合適。
(3) 嚴格按照測驗程序進行測量 , 防止測量誤差 : 要嚴格按照測驗手冊進行測量 , 不能作過多的解釋 , 按標准評分 , 兩次測驗間隔要適當。
(4) 樣本容量要適當 : 當樣本容量增大時 , 樣本對總體的代表性提高 , 樣本大 , 被試的內部差異增大 , 擴大了真分數的方差 , 使效度提高。 樣本容量一般不應低於 30 。另外 , 抽樣方法也很重要 , 一般用隨機抽樣 , 當群體很大時 , 可分層抽樣 , 樣本容量擴大時 , 其代表性才隨之增大。
(5) 正確處理好信度與效度的關系 : 信度是效度的必要條件 , 但信度高的測驗 , 效度不一定高 ; 而效度高的測驗 , 信度卻比較高。但是 , 既要有高效度 , 又要有高信度是不容易做到的。「最大可靠度(信度)要求測驗項目之間有高度的組間相關; 最大預測有效度卻要求低度的組間相關。最大可靠度(信度)要求項目等同的難度; 最大預測有效度卻要求項目的難度有所區別。中等程度的組間相關( 0.10 ─ 0.60), 通常可產生良好的效度 (0.30 ─ 0.80), 並且產生滿意的信度 (0.90) 。」 ( 郝德員 : 《教育與心理統計》 , 教育科學出版社 ,1962 年版 .P429)
(6) 適當增加測驗的長度 : 增加測驗的長度可提高測驗的信度 , 也可以提高效度 , 但增加測驗的長度對信度的影響大於對效度的影響。如果增加測驗 長度到原來的 n 倍 。
Ⅱ 如何提高測試的效度和信度
信度是指測驗結果的一致性、穩定性及可靠性,一般多以內部一致性來加以表示該測驗信度的高低。信度系數愈高即表示該測驗的結果愈一致、穩定與可靠。系統誤差對信度沒什麼影響,因為系統誤差總是以相同的方式影響測量值的,因此不會造成不一致性。反之,隨機誤差可能導致不一致性,從而降低信度。
效度(Validity)即有效性,它是指測量工具或手段能夠准確測出所需測量的事物的程度。效度是指所測量到的結果反映所想要考察內容的程度,測量結果與要考察的內容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:內容效度、准則效度和結構效度。
提高測驗信度的方法 :
( 1 )適當延長測驗的長度 :
測驗的長度主要指量表所包含的題目多少。對一個測驗來說 , 測驗的題目越少 , 得分越容易受偶然因素的影響 , 故測驗的信度越低。 反之如果測驗題目較多 , 即測驗長度延長 , 擴大了被試得分范圍 , 可在一定程度上排除偶然因素的影響 , 從而提高測驗信度。但是測驗信度的增加並不是等比例提高信度系數。當信度系數較小時 , 延長測驗長度信度系數增加較大 ; 當信度系數已經較大時 , 延長測驗長度對信度系數的影響就較小了。而且 , 在延長測驗長度時 , 還需考慮其他因素的影響 , 如被試在回答問題時是否疲倦或產生厭煩情緒 , 是否節省時間、物力和財力 , 測題是否附合測驗目的等。
( 2 )測驗的難度要適中 : 難度即測驗的難易程度 , 當測驗難度太大時 , 被試得分普遍太低 , 呈負偏態分布 ; 當測驗難度太小時 , 被試得分普遍較高 , 呈正偏態分布。太難太易的測驗都使被試得分差異減小 , 使實得分數方差減小 , 從而降低測驗信度。
( 3 )測驗的內容盡量同質 : 性質相同的測驗內容 , 對被試也要求相同的能力、知識和技能 ; 而內容不同質的測驗 , 則要求被試不同的能力、 知識和技能。因而為了提高測驗信度 , 測驗內容應盡量同質。
( 4 )測驗的時間要充分 : 對某一測驗而言 , 應保證絕大多數被試在規定時間內完成測驗 ; 否則 , 如果被試不能從容回答所有問題 , 就不能反映被試的真實水平。
( 5 )測驗的程序要統一 : 包括測驗的題目統一 , 指導語、 回答問題的方式、分收試卷的方法、測驗時間等都要統一。
( 6 )評分要客觀 : 評分是否客觀對測驗信度有直接的影響。對於客觀性題目 , 評分標准明確 , 評分容易做到客觀 ; 但對於主觀性題目 , 受評分者影響較大 , 不易做到客觀。為了盡可能客觀評分 , 應制定明確而易掌握的評分標准 , 盡量做到一卷多評 , 或一人只評一題等。
提高測驗效度的方法 :
( 2 )控制系統誤差 : 系統誤差是影響測驗效度的主要因素。它主要包括儀器不準 , 題目和指導語有暗示性 , 答案按排不當 ( 被試可以猜測 ) 等 , 控制這些因素可以降低系統誤差 , 提高效度。
(2) 精心編制測題和測驗量表 : 首先測題內容要適合測驗目的 , 如知識性測題就不能全面反映被試的智力水平 , 它主要測量其知識水平。其次 , 測題要清楚明了 , 用語要讓被試理解 , 排列由易到難。第三 , 測題的難度和曲分度要合適。
(3) 嚴格按照測驗程序進行測量 , 防止測量誤差 : 要嚴格按照測驗手冊進行測量 , 不能作過多的解釋 , 按標准評分 , 兩次測驗間隔要適當。
(4) 樣本容量要適當 : 當樣本容量增大時 , 樣本對總體的代表性提高 , 樣本大 , 被試的內部差異增大 , 擴大了真分數的方差 , 使效度提高。 樣本容量一般不應低於 30 。另外 , 抽樣方法也很重要 , 一般用隨機抽樣 , 當群體很大時 , 可分層抽樣 , 樣本容量擴大時 , 其代表性才隨之增大。
(5) 正確處理好信度與效度的關系 : 信度是效度的必要條件 , 但信度高的測驗 , 效度不一定高 ; 而效度高的測驗 , 信度卻比較高。但是 , 既要有高效度 , 又要有高信度是不容易做到的。「最大可靠度(信度)要求測驗項目之間有高度的組間相關; 最大預測有效度卻要求低度的組間相關。最大可靠度(信度)要求項目等同的難度; 最大預測有效度卻要求項目的難度有所區別。中等程度的組間相關( 0.10 ─ 0.60), 通常可產生良好的效度 (0.30 ─ 0.80), 並且產生滿意的信度 (0.90) 。」 ( 郝德員 : 《教育與心理統計》 , 教育科學出版社 ,1962 年版 .P429)
(6) 適當增加測驗的長度 : 增加測驗的長度可提高測驗的信度 , 也可以提高效度 , 但增加測驗的長度對信度的影響大於對效度的影響。如果增加測驗 長度到原來的 n 倍 。
Ⅲ 心理測量學簡述提高測驗效度的方法有哪些
提高測驗效度的方法有四種:
1) 為了避免出現較大的系統誤差,精心編制測驗量表;
2)為了控制隨機誤差,妥善組織測驗;
3) 為了讓每個被試發揮出政策水平,創設標準的應試情境;
4) 校標選擇正確,校標測量制定合適,有關公式使用正確。
一個測驗或者是量表實際能測出其所要測的心理特質的程度,就是效度。它是相對於一定的測量目的而言的;
同時,心理測量不可能達到百分之百的准確,只能達到某種程度上的准確;
效度是測量的隨機誤差和系統誤差的綜合反映。判斷一個測量是否有效,要從多方面收集證據。
(3)提高效度的常用方法有哪些擴展閱讀
測量效度分類:
1. 用測量的內容來說明目的,稱為內容效度;
2. 用心理學上某種理論結構來說明目的,稱為結構效度;
3. 用工作實效來說明目的,稱為實證效度;
Ⅳ 如何提高心理測驗的信度和效度
提高信度的方法:1.適當增加測驗長度2.使測驗中所有的試題的難度接近正態分布,並控制在中等水平3.努力提高測驗試題的區分度4.選取恰當的被試,提高測驗在各同質性較強的亞團體上的信度5.主試者嚴格執行測驗規程,評分者嚴格標准評分,實測場地按測驗手冊的要求布置,減少無關因素的干擾。提高效度的方法:1.精心編制測驗量表,避免出現較大的系統誤差2.妥善組織測驗,控制隨機誤差3.創設標準的應試情境,讓每個被試都發揮出正常水平4.選好正確的效標,定好恰當的效標測量,正確使用有關公式
Ⅳ 求提高問卷信度效度的方法
1、把簡單易答的問題放在前面,把復雜難答的問題放在後面。
把能引起被調查者興趣的問題放在前面,把容易引起他們緊張或產生顧慮的問題放在後面;把被調查者熟悉的問題放在前面,把他們感到生疏的問題放在後面;或者是一般先問行為方面的問題,再問態度、意見、看法方面的問題等等。
2、可以相互檢驗的問題必須分隔開。可以起到相互檢驗和相互印證的作用。
3、問卷的長度或者其所包含的問題,一般以受訪者能在半小時內完成為宜。
問卷設計注意事項
1、問卷中所提的問題,應圍繞研究目的來編制,力求簡單、明了,含義准確。不要出現雙關語,避免片面和暗示性的語言。
2、問題不要超過被調查者的知識、能力范圍。
3、問題排列要有一定的邏輯次序,層次分明。問卷的目的、內容、數據、卷面安排標准答案等都要認真地推敲和設計。
4、調查表上應有留給供人填寫答案的足夠空間,並編有填寫調查單位的名稱、填表人的姓名和填表年月日的欄目。
5、為使調查結果更為客觀、真實,問卷最好採用匿名回答的方式。
Ⅵ 如何提高信度和效度
減小測驗時的非系統性誤差,即可提高信度和效度。在社會測量中,對作為測量工具的問卷或量表的效度要求較高。鑒別效度須明確測量的目的與范圍,考慮所要測量的內容並分析其性質與特徵,檢查測量的內容是否與測量的目的相符,進而判斷測量結果是否反映了所要測量的特質的程度。提高信度和效度的具體要求如下:
1、效標必須能最有效地反映測驗的目標,即效標測量本身必須有效;
2、效標必須具有較高的信度,穩定可靠,不隨時間等因素而變化;
3、效標可以客觀地加以測量,可用數據或等級來表示;
4、效標測量的方法簡單。
(6)提高效度的常用方法有哪些擴展閱讀:
信度和效度的關系:
問卷的信度與效度之間既有明顯的區別,又存在著相互聯系、相互制約的關系。信度主要回答測量結果的一致性、穩定性和可靠性問題;效度主要回答測量結果的有效性和正確性問題。
效度和信度的關系可以用測量值的構成公式O=T S R來理解。如果測量是完全有效的,即0=T,S=0,R=0,此時測量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因為有O=T R。
如果量表是完全可信的,可以達到完全有效,也可能達不到,因為有可能存在導致誤差,雖然缺乏信度必然缺乏效度,但信度的大小並不能體現效度的大小。信度是效度的必要條件,但不是充分條件。
從理論的角度來看,量應具有足夠的效度和信度;從實踐的觀點來看,一個好的量表還應該具有實用性。實用性指量表的經濟性、便利性和可解釋性。一般來說,信度是效度的必要條件,也就是說,效度都必須建立在信度的基礎上;但是沒有效度的測量,即使它的信度再高,這樣的測量也是沒有意義的。
Ⅶ 提高效度的主要方法是什麼 心理測量學
效度呀,方法入下
Ⅷ 提高測驗效度的方法有哪些
測驗效度是衡量一個測驗的內容與它所要測量的對象特徵的相符程度的指標。如果一個測驗能夠准確地測量到它所要測量的東西,這個測驗就是有效的。
1、控制系統誤差:系統誤差是影響測驗效度的主要因素。它主要包括儀器不準,題目和指導語有暗示性,答案按排不當(被試可以猜測)等,控制這些因素可以降低系統誤差,提高效度。
2、精心編制測題和測驗量表:首先測題內容要適合測驗目的,如知識性測題就不能全面反映被試的智力水平,它主要測量其知識水平。其次,測題要清楚明了,用語要讓被試理解,排列由易到難。第三,測題的難度和曲分度要合適。
3、嚴格按照測驗程序進行測量,防止測量誤差:要嚴格按照測驗手冊進行測量,不能作過多的解釋,按標准評分,兩次測驗間隔要適當。
4、樣本容量要適當:當樣本容量增大時,樣本對總體的代表性提高,樣本大,被試的內部差異增大,擴大了真分數的方差,使效度提高。樣本容量一般不應低於30。另外,抽樣方法也很重要,一般用隨機抽樣,當群體很大時,可分層抽樣,樣本容量擴大時,其代表性才隨之增大。
提高測驗信度的方法:
1、測驗的難度要適中:難度即測驗的難易程度,當測驗難度太大時,被試得分普遍太低,呈負偏態分布;當測驗難度太小時,被試得分普遍較高,呈正偏態分布。太難太易的測驗都使被試得分差異減小,使實得分數方差減小,從而降低測驗信度。
2、測驗的內容盡量同質:性質相同的測驗內容,對被試也要求相同的能力、知識和技能;而內容不同質的測驗,則要求被試不同的能力、知識和技能。因而為了提高測驗信度,測驗內容應盡量同質。
3、測驗的時間要充分:對某一測驗而言,應保證絕大多數被試在規定時間內完成測驗;否則,如果被試不能從容回答所有問題,就不能反映被試的真實水平。
Ⅸ 如何提高訪談的信度和效度
在人員選拔中,訪談法是被人們應用最廣同時也是研究最多的方法之一。文章著重討論兩個問題,訪談法與其他人員選拔方法的可接受性程度比較,關於影響訪談的信度、效度的因素的議論,結果發現,與其他的人員選拔方法相比,訪談法具有更高的可接受性;
結構因素被認為是影響訪談效度的主要變數,而且訪談的效度增加,隨著結構化程度的提高存在著頂層效應,通過訪談信度的分析,能為效度上限的估計提供研究的思路。
(9)提高效度的常用方法有哪些擴展閱讀:
注意事項:
訪談信度通常是通過比較兩個或更多的評分者對被訪談者反應的評定來確定的。通過這些評定計算出來的評分者內部一致性系數的大小,隨著訪談問題和被評定行為的特殊性而變化;
B常結構化訪談和半結構化訪談的評分者內部一致性系數要高於非結構化訪談。然而,即使是結構化訪談,並且訪談的問題相當客觀和明確,評分者信度通常也不會超過0.80。
Ⅹ 提高測評效度的方法 考試題題目,300字以內
測評信效度主要還是看常模。
解決方法:
1、測評與選拔的可靠性分析
在人員測評與選拔中,結果的可靠性是由測評信度來鑒定,所謂信度是指人員測評與選拔結果的准確性或一致性程度。按照衡量測評信度程度的方法不同,信度可分為再測信度、復本信度、內在一致性信度和評分者信度。
(1)再測信度。指以同樣的測評與選拔工具,按照同樣的方法,對於相同的對象再次進行測評與選拔,所得先後結果的一致性程度。再測信度的兩次測評使用的是同一個測評工具,同一種測評方式,但較難把握的是兩次測評間隔的時間長短。時間間隔過長,被測者特徵將隨時間的增加而發展變化,由此計算的穩定系數將失去意義;若時間間隔過短,又可能產生記憶與練習效應,這也將影響穩定系數。一般來說,時間間隔不應是固定不變的,不同性質的人時間間隔應有區別,通常為1至3個月之間。在進行測評結果報告時,應報告兩次測評的間隔時間,以及在此期間內被測者的相關經歷。
(2)復本信度。指測評與選拔結果與另一個等值測評與選拔結果的一致性程度。所謂等值,是指在測評內容、效度、要求、形式上都與原測評一樣,其中一個測評可以看作是另一個測評的近似復寫,即復本。如果兩個復本測評相距一段時間分兩次實施,則在鑒定復本信度的同時還可鑒定再測信度,可見它應用范圍的廣泛。鑒定復本信度,首先要編制等值的復本。編制嚴格平行的復本難度較大,這也是制約復本信度的主要因素。此外,復本信度雖能較好地克服再測信度的練習、記憶效應,但原測評中的一些技能技巧也會產生遷移效應。
(3)內在一致性信度。指所測素質相同的各測評項目分數間的一致性程度。若被測的第一個項目的分數高於他人,在第二個項目的分數還高於其他人,在第三個項目的分數仍高於他人……且這些測評項目所測評的是同一素質,那麼有理由認為測評與選拔結果較可靠。再測信度與復本信度都需要組織兩次測評,而內在一致性信度只需要進行一次測評,增加了人員測評的可操作性,同時也為實際工作帶來了極大的方便。
(4)評分者信度。指多個測評者給同一組被測樣組進行評分的一致性程度。測評與選拔結果的差異程度來自兩方面:一是被測評者自身,二是被測評者及其測評。信度主要是對後者的度量,測評者及其測評的無關差異越小,測評與選拔結果就越可靠。測評者的評分是引起主觀性測評結果差異的主要原因。客觀性測評是利用計算機評分,不受主觀因素影響,不存在評分誤差。
2、測評與選拔的有效性分析
上面我們對測評信度進行了簡要描述,目的是提高測評的可信度。測評的有效性也即測評效度是人才測評與選拔質量檢驗的重要內容,尤其是對測評選拔反饋有重要的指導和參考修正價值。效度的具體內容主要包含以下幾個方面:
(1)內容效度。是指實際測評到的內容與期望測評的內容的一致性程度。內容效度在實際操作中的鑒定主要採用定性分析的方法,有藍圖對照分析法與專家比較判斷法。所謂的藍圖對照法實際上就是將測評內容與設計藍圖對照,做出分析判斷。專家比較判斷法是由一組獨立的專家組成專家評定組,對測評量表內容取樣的充分性、必要性、適合性進行評定,對實際測評到的內容與所要測素質特徵的符合程度做出判斷。
(2)結構效度。又稱作構想效度、構思效度、構建效度等。在測評實踐中,有些指標我們是不能直接測評得到答案的,例如智力、動機、態度、品德、善良、誠實等抽象概念,這時候我們只能藉助於具體的行為測評來推斷。把抽象素質構建成具體行為特徵,是否抓住了該素質的本質特徵進行構建是最關鍵的,這就是結構效度問題。它表明了在多大程度上,實際的測評結果能夠被看作是所要測評的素質在結構上的替代物。
不難看出,結構效度的判斷是一個難點。在實際操作中,這里也是最復雜的一個環節之一。構建一個素質結構模型是非常必要的,包括項目、指標、權重、標度等。然後,根據事實材料評判結構效度。就是根據實際的測評結果,結合專家小組的意見和邏輯分析等方法,評判結構效度。這一點對於測評結果的反饋修正具有重要價值。
(3)關聯效度。是指測評結果與效標的一致性程度。效標是一種用來衡量測評有效性的外在參照標准,它可以是一種測評的結果,也可以是標准測評分數。根據效標是否可以同時獲得,可將關聯效度分為同時效度與預測效度。作為效標的結果與預測結果同時獲得,這種效度稱之為同時效度。當作為效標的結果是後來測評中獲得,這種效度稱為預測效度。它反映了現在的測評結果對未來素質發展的預測程度。不同的測評目的,對於效度的要求也不盡相同。例如,通過測評來選拔人才,則希望測評有較高的預測效度;通過測評來開發培訓人才,則希望測評兼備較高的同時效度和預測效度。
四、總結
當然,影響信度的因素有很多,主要是系統誤差和隨機誤差。包括測評者的專業性和素質、被測評者本人心理、測評工具的穩定性、環境穩定性等都會影響測評的可信度。在實際測評過程中要把握各相關方面,不僅要有專業的測評人員,同時也要在穩定的環境中為被測評者提供一個放鬆真實的氛圍。測評的效度也是受多因素影響的,如測評工具,測評過程及測評這因素,被測評者狀態,效標因素和信度因素等。其中信度和效度之間的關系是:高信度是高效度的必要條件,但非充分條件。即信度高不一定其效度就高,但想獲得較高的測評效度,其信度必定要高。信度和效度是人才測評與選拔質量的重要指標。運用數量方法進行定量研究,有利於提高測評的有效性,進而做出正確的選拔決策。對於低效度、信度的測評指標,可以及時做出調整,完善指標體系,對於建立企業自身完善的測評反饋機制有重要意義。