㈠ 熵值法spss具體步驟是什麼
熵值法的計算公式上會有取對數,因此如果小於等於0的數字取對數,則會出現null值。此種情況共有兩種辦法。
第一種:SPSSAU非負平移功能是指,如果某列(某指標)數據出現小於等於0,則讓該列數據同時加上一個『平移值』【該值為某列數據最小值的絕對值+0.01】,以便讓數據全部都大於0,因而滿足演算法要求。
第二種:研究者也可以手工查看數據並將小於等於0的數據設置為異常值,但此種做法會讓樣本減少。
(1)熵值法屬於研究方法擴展閱讀:
由於各項指標的計量單位並不統一,因此在用它們計算綜合指標前,我們先要對它們進行標准化處理,即把指標的絕對值轉化為相對值,從而解決各項不同質指標值的同質化問題。而且,由於正向指標和負向指標數值代表的含義不同(正向指標數值越高越好,負向指標數值越低越好) ,因此,對於高低指標我們用不同的演算法進行數據。
㈡ 分類數據分析中的擬合優度檢驗
知識圖譜
繼續我們的知識總結,本文總結包括:多選題研究、聚類分析研究、權重研究、非參數檢驗、數據分布。
查看本系列之前的文章,可點擊下面的鏈接:論文里的分析方法要用哪一種,SPSSAU告訴你答案論文常用數據分析方法分類總結-2
11. 多選題研究
多選題分析-SPSSAU
多選題分析可分為四種類型包括:多選題、單選-多選、多選-單選、多選-多選。
「多選題分析」是針對單個多選題的分析方法,可分析多選題各項的選擇比例情況
「單選-多選」是針對X為單選,Y為多選的情況使用的方法,可分析單選和多選題的關系。
「多選-單選」是針對X為多選,Y為單選的情況使用的方法。
「多選-多選」是針對X為多選,Y為多選的情況使用的方法。
12. 聚類分析
聚類分析-SPSSAU
聚類分析以多個研究標題作為基準,對樣本對象進行分類。
如果是按樣本聚類,則使用SPSSAU的進階方法模塊中的「聚類」功能,系統會自動識別出應該使用K-means聚類演算法還是K-prototype聚類演算法。
如果是按變數(標題)聚類,此時應該使用分層聚類,並且結合聚類樹狀圖進行綜合判定分析。
13. 權重研究
權重研究-SPSSAU
權重研究是用於分析各因素或指標在綜合體系中的重要程度,最終構建出權重體系。權重研究有多種方法包括:因子分析、熵值法、AHP層次分析法、TOPSIS、模糊綜合評價、灰色關聯等。
因子分析:因子分析可將多個題項濃縮成幾個概括性指標(因子),然後對新生成的各概括性指標計算權重。
熵值法:熵值法是利用熵值攜帶的信息計算每個指標的權重,通常可配合因子分析或主成分分析得到一級權重,利用熵值法計算二級權重。
AHP層次分析法:AHP層次分析法是一種主觀加客觀賦值的計算權重的方法。先通過專家打分構造判斷矩陣,然後量化計算每個指標的權重。
TOPSIS法:TOPSIS權重法是一種評價多個樣本綜合排名的方法,用於比較樣本的排名。
模糊綜合評價:是通過各指標的評價和權重對評價對象得出一個綜合性評價。
灰色關聯:灰色關聯是一種評價多個指標綜合排名的方法,用於判斷指標排名。
14. 非參數檢驗
非參數檢驗-SPSSAU
非參數檢驗用於研究定類數據與定量數據之間的關系情況。如果數據不滿足正態性或方差不齊,可用非參數檢驗。
單樣本Wilcoxon檢驗用於檢驗數據是否與某數字有明顯的區別。
如果X的組別為兩組,則使用MannWhitney統計量,如果組別超過兩組,則應該使用Kruskal-Wallis統計量結果,SPSSAU可自動選擇。
如果是配對數據,則使用配對樣本Wilcoxon檢驗
如果要研究多個關聯樣本的差異情況,可以用多樣本Friedman檢驗。
如果是研究定類數據與定量(等級)數據之間的差異性,還可以使用Ridit分析。
15. 數據分布
數據分布-SPSSAU
判斷數據分布是選擇正確分析方法的重要前提。
正態性:很多分析方法的使用前提都是要求數據服從正態性,比如線性回歸分析、相關分析、方差分析等,可通過正態圖、P-P/Q-Q圖、正態性檢驗查看數據正態性。
隨機性:遊程檢驗是一種非參數性統計假設的檢驗方法,可用於分析數據是否為隨機。
方差齊性:方差齊檢驗用於分析不同定類數據組別對定量數據時的波動情況是否一致,即方差齊性。方差齊是方差分析的前提,如果不滿足則不能使用方差分析。
Poisson分布:如果要判斷數據是否滿足Poisson分布,可通過Poisson檢驗判斷或者通過特徵進行判斷是否基本符合Poisson分布(三個特徵即:平穩性、獨立性和普通性)
卡方擬合優度檢驗:卡方擬合優度檢驗是一種非參數檢驗方法,其用於研究實際比例情況,是否與預期比例表現一致,但只針對於類別數據。
單樣本T檢驗:單樣本T檢驗用於分析定量數據是否與某個數字有著顯著的差異性。
上述分析方法均可在SPSSAU中使用分析,以及相關方法問題可查看SPSSAU幫助手冊。
㈢ 如何用熵權法計算權重
熵權法是一種客觀賦權方法。十分復雜,計算步驟如下:
1、構建各年份各評價指標的判斷矩陣。
2、將判斷矩陣進行歸一化處理, 得到歸一化判斷矩陣。
3、根據熵的定義,根據各年份評價指標,可以確定評價指標的熵。
4、定義熵權。定義了第n個指標的熵後,可得到第n個指標的熵權。
5、計算系統的權重值。
根據信息熵的定義,對於某項指標,可以用熵值來判斷某個指標的離散程度,其信息熵值越小,指標的離散程度越大, 該指標對綜合評價的影響(即權重)就越大,如果某項指標的值全部相等,則該指標在綜合評價中不起作用。
因此,可利用信息熵這個工具,計算出各個指標的權重,為多指標綜合評價提供依據。
注意事項:
系統由有序轉變為無序被的過程是熵增,比如系的鞋帶會開;家中鋪的很整齊的床單睡過後會變亂。
「熱力學第二定律」熱量可以自發地從較熱的物體傳遞到較冷的物體,但不可能自發地從較冷的物體傳遞到較熱的物體。
比如一滴墨滴進清水,清水會變黑;一個熱的物體和一個冷的物體放在一起,熱的物體會變冷,冷的物體會變熱.....物理系統總是會趨向平衡狀態。
一個系統的溫度是不均勻的,它慢慢趨向均勻;一個溶液的濃度是不均勻的,同樣它會慢慢趨向均勻。
㈣ 除了主成分分析法還有什麼確定多變數權重的方法
權重計算的確定方法在綜合評價中重中之重,不同的方法對應的計算原理並不相同。在實際分析過程中,應結合數據特徵及專業知識選擇適合的權重計算。
第一類為AHP層次法和優序圖法;此類方法利用數字的相對大小信息進行權重計算;此類方法為主觀賦值法,通常需要由專家打分或通過問卷調研的方式,得到各指標重要性的打分情況,得分越高,指標權重越大。
此類方法適合於多種領域。比如想構建一個員工績效評價體系,指標包括工作態度、學習能力、工作能力、團隊協作。通過專家打分計算權重,得到每個指標的權重,並代入員工數據,即可得到每個員工的綜合得分情況。
第二類為熵值法(熵權法);此類方法利用數據熵值信息即信息量大小進行權重計算。此類方法適用於數據之間有波動,同時會將數據波動作為一種信息的方法。
比如收集各地區的某年份的經濟指標數據,包括產品銷售率(X1)、資金利潤率(X2)、成本費用利潤率(X3)、勞動生產率(X4)、流動資金周轉次數(X5),用熵值法計算出各指標權重,再對各地區經濟效益進行比較。
第三類為CRITIC、獨立性權重和信息量權重;此類方法主要是利用數據的波動性或者數據之間的相關關系情況進行權重計算。
比如研究利用某省醫院2011年共計5個科室的數據指標(共計6個指標數據)進行CRITIC權重計算,最終可得到出院人數、入出院診斷符合率、治療有效率、平均床位使用率、病床周轉次數、出院者平均住院日這6個指標的權重。如果希望針對各個科室進行計算綜合得分,那麼可以直接將權重與自身的數據進行相乘累加即可,分值越高代表該科室評價越高。
第四類為因子分析和主成分法;此類方法利用了數據的信息濃縮原理,利用方差解釋率進行權重計算。
比如對30個地區的經濟發展情況的8項指標作主成分分析,主成分分析法可以將8個指標濃縮為幾個綜合指標(主成分),用這些指標(主成分)反映原來指標的信息,同時利用方差解釋率得出各個主成分的權重。
㈤ 熵值法得出的結果全是0
熵值法的計算公式上會有取對數,因此如果小於等於0的數字取對數,則會出現null值。
此種情況共有兩種辦法。 第一種:對數值為0的指標非負平移,如果某列(某指標)數據出現小於等於0,則讓該列數據同時加上一個『平移值』【該值為某列數據最小值的絕對值+0.01】,以便讓數據全部都大於0,因而滿足演算法要求。 第二種:研究者也可以手工查看數據並將小於等於0的數據設置為異常值,這種做法會讓樣本減少。 SPSSAU這兩種方法都有提供,在綜合評價》熵值法,可以進行分析。
㈥ 客觀賦權法
客觀賦權法主要有變異系數法、熵值法和多元統計分析法,其原始數據來自評估矩陣的數據。它的基本原理是利用指標的觀測值進行賦權,權重的確定完全由統計數據得出。這類方法切斷了權重系數的主觀性來源,使系數具有絕對的客觀性,但卻容易出現 「重要指標的權重系數小而不重要指標的權重指標系數大」的不合理現象。
(一)變異系數法
變異系數法的基本思想是:在通過指標體系進行評估時,指標體系中各指標所包含的信息量不同,即各指標對被評估對象的區分能力不同。一般來講,如果一個指標能夠明確區分其他指標,則該指標與其他指標的差異大,說明該指標包含的信息量大,應該賦予該指標較大的權重;反之,則應賦予較小的權重。在統計學中,指標的變異信息量常用方差衡量,但由於指標量綱和數量級的差異,各指標的方差不具有可比性。因此,選用各指標的變異系數作為衡量指標變異信息量大小的指標。將各指標的變異系數做歸一化處理,就可得到各指標的權重。具體過程如下:
設指標體系由m個指標組成,有n個參評樣本,計算出各指標的均值和方差:
地質資料社會化服務評估研究
則各指標的變異系數為:
地質資料社會化服務評估研究
對Vi做歸一化處理,即可得出各指標的權重wi
地質資料社會化服務評估研究
(二)熵值法
熵是資訊理論中測量不確定性的量,信息量越大,不確定性就越小,熵也就越小。反之,信息量越小,不確定性就越大,熵也就越大。熵值法就是用指標熵值來確定權重大小的方法。一般的,將評估對象集記為{Ai}(i=1,2,…,m),用於評估的指標集記為{Xj}(j=1,2,…,n),用xij表示第i個方案第j個指標的原始值。熵值法的計算過程為:
(1)將xij做正向化處理,並計算第j個指標第i個方案所佔的比重pij
地質資料社會化服務評估研究
(2)計算第j個指標的熵值ej
地質資料社會化服務評估研究
(3)計算第j個指標的差異系數gj
地質資料社會化服務評估研究
(4)計算第j個指標的權重wj
地質資料社會化服務評估研究
熵值法是突出局部差異的權重計算方法,是根據同一指標觀測值之間的差異程度來反映其重要程度的。這種方法,有時可能造成重要指標的權重系數小而不重要指標的權重系數大的不合理現象。
(三)多元統計分析法
多元統計分析法是處理多變數數據的有力工具,在構建評估指標體系的權重時,主要使用到主成分分析法和因子分析法。
1.主成分分析法(Principal component analysis)
用主成分分析法進行多指標綜合評價的基本原理是通過適當的數學變換使新的指標成為原有指標的線性組合,並用較少的指標(主成分)代替原有指標,主成分之間相互獨立。可以證明:指標的協方差矩陣的第k個特徵值等於第k個主成分的方差(k=1,2,…,n);其對應的特徵向量是第k個主成分的相應系數;並且主成分按照方差大小順序排列。因此,第一主成分代表原有指標的信息最多,第二主成分次之,根據此原理,利用主成分能構造綜合指數。
主成分分析確定權重的步驟如下:
(1)原始指標數據標准化;
(2)計算指標間的相關系數矩陣R;
(3)計算R的特徵根和特徵向量;
(4)根據主成分的方差貢獻率 確定主成分個數p;
(5)將p個主成分綜合為綜合指數。
2.因子分析法(Factor analysis)
用因子分析法確定權重的原理是:從所研究的全部原始變數中,將有關信息集中起來,通過討論相關矩陣的內部依賴關系,將多指標綜合成少數因子(綜合指標),再現指標與因子之間的相關關系,並進一步分析這些相關關系的內部原因。因子分析法確定權重的步驟是:
(1)原始指標數據標准化;
(2)計算指標間的相互關系矩陣R;
(3)計算R的特徵根和特徵向量;
(4)根據方差貢獻率 (α一般取85%)確定特徵根的個數和和相應的特徵向量Ui(i=1,2,…,m),利用m個特徵值和特徵向量建立初始因子載荷矩陣 ;
(5)建立因子模型:
地質資料社會化服務評估研究
式中f1,f2,…,fm為公共因子;ξ為特殊因子。
(6)對初始因子載荷矩陣進行旋轉變換,使載荷矩陣結構簡單,關系明確。如果初始因子間不相關,採用方差進行極大正交旋轉;如果因子間有相關關系,則進行斜交旋轉。通過旋轉得到比較理想的因子在乎矩陣Al=(ai,j)n×m;
(7)將因子表示為變數的線性組合,由最小二乘法估計求出因子得分系數矩陣:
地質資料社會化服務評估研究
(8)確定權重。指標xj的權重是 其中 為方差貢獻率,將βi歸一化為xj的權重。
㈦ 不知道怎樣計算權重告訴你8種確定權重方法
計算權重是一種常見的分析方法,在實際研究中,需要結合數據的特徵情況進行選擇,比如數據之間的波動性是一種信息量,那麼可考慮使用CRITIC權重法或信息量權重法;也或者專家打分數據,那麼可使用AHP層次法或優序圖法。
本文列出常見的權重計算方法,並且對比各類權重計演算法的思想和大概原理,使用條件等,便於研究人員選擇出科學的權重計算方法。
首先列出常見的8類權重計算方法,如下表所示:
這8類權重計算的原理各不相同,結合各類方法計算權重的原理大致上可分成4類,分別如下:
第一類、信息濃縮 (因子分析和主成分分析)
計算權重時,因子分析法和主成分法均可計算權重,而且利用的原理完全一模一樣,都是利用信息濃縮的思想。因子分析法和主成分法的區別在於,因子分析法加帶了『旋轉』的功能,而主成分法目的更多是濃縮信息。
『旋轉』功能可以讓因子更具有解釋意義,如果希望提取出的因子具有可解釋性,一般使用因子分析法更多;並非說主成分出來的結果就完全沒有可解釋性,只是有時候其解釋性相對較差而已,但其計算更快,因而受到廣泛的應用。
比如有14個分析項,該14項可以濃縮成4個方面(也稱因子或主成分),此時該4個方面分別的權重是多少呢?此即為因子分析或主成分法計算權重的原理,它利用信息量提取的原理,將14項濃縮成4個方面(因子或主成分),每個因子或主成分提取出的信息量(方差解釋率)即可用於計算權重。接下來以SPSSAU為例講解具體使用因子分析法計算權重。
如果說預期14項可分為4個因子,那麼可主動設置提取出4個因子,相當於14句話可濃縮成4個關鍵詞。
但有的時候並不知曉到底應該多少個因子更適合,此時可結合軟體自動推薦的結果和專業知識綜合進行判斷。點擊SPSSAU『開始分析』後,輸出關鍵表格結果如下:
上表格中黃色底紋為『旋轉前方差解釋率』,其為沒有旋轉前的結果,實質上就是主成分的結果。如果是使用因子分析,一般使用『旋轉後方差解釋率』對應的結果。
結果中方差解釋率%表示每個因子提取的信息量,比如第1個因子提取信息量為22.3%,第2個因子為21.862%,第3個因子為18.051%,第4個因子為10.931%。並且4個因子累積提取的信息量為73.145%。
那麼當前4個因子可以表述14項,而且4個因子提取出14項的累積信息量為73.145%。現希望得到4個因子分別的權重,此時可利用歸一化處理,即相當於4個因子全部代表了整體14項,那麼第1個因子的信息量為22.3%/73.145%=30.49%;類似的第2個因子為21.862%/73.145%=29.89%;第3個因子為18.051%/73.145%=24.68%;第4個因子為10.931%/73.145%=14.94%。
如果是使用主成分法進行權重計算,其原理也類似,事實上結果上就是『旋轉前方差解釋率』值的對應計算即可。
使用濃縮信息的原理進行權重計算時,只能得到各個因子的權重,無法得到具體每個分析項的權重,此時可繼續結合後續的權重方法(通常是熵值法),得到具體各項的權重,然後匯總在一起,最終構建出權重體系。
通過因子分析或主成分分析進行權重計算的核心點即得到方差解釋率值,但在得到權重前,事實上還有較多的准備工作,比如本例子中提取出4個因子,為什麼是4個不是5個或者6個;這是結合專業知識和分析方法提取的其它指標進行了判斷;以及有的時候某些分析項並不適合進行分析,還需要進行刪除處理後才能進行分析等,此類准備工作是在分析前准備好,具體可參考SPSSAU幫助手冊裡面有具體的實際案例和視頻說明等。
第二類、數字相對大小 (AHP層次法和優序圖法)
計算權重的第二類方法原理是利用數字相對大小,數字越大其權重會相對越高。此類原理的代表性方法為AHP層次法和優序圖法。
1. AHP層次法
AHP層次分析法的第一步是構建判斷矩陣,即建立一個表格,表格裡面表述了分析項的相對重要性大小。比如選擇旅遊景點時共有4個考慮因素,分別是景色,門票,交通和擁護度,那麼此4個因素的相對重要性構建出判斷矩陣如下表:
表格中數字代表相對重要的大小,比如門票和景色的數字為3分,其說明門票相對於景色來講,門票更加重要。當然反過來,景色相對於門票就更不重要,因此得分為1/3=0.3333分。
AHP層次分析法正是利用了數字大小的相對性,數字越大越重要權重會越高的原理,最終計算得到每個因素的重要性。AHP層次分析法一般用於專家打分,直接讓多位專家(一般是4~7個)提供相對重要性的打分判斷矩陣,然後進行匯總(一般是去掉最大值和最小值,然後計算平均值得到最終的判斷矩陣,最終計算得到各因素的權重。
SPSSAU共有兩個按鍵可進行AHP層次分析法計算。
如果是問卷數據,比如本例中共有4個因素,問卷中可以直接問「景色的重要性多大?」,「門票的重要性多大?」,「交通的重要性多大?」,「擁護度的重要性多大?」。可使用SPSSAU【問卷研究】--【權重】,系統會自動計算平均值,然後直接利用平均值大小相除得到相對重要性大小,即自動計算得到判斷矩陣而不需要研究人員手工輸入。
如果是使用【綜合評價】--【AHP層次分析法】,研究人員需要自己手工輸入判斷矩陣。
2. 優序圖法
除了AHP層次分析法外,優序圖法也是利用數字的相對大小進行權重計算。
數字相對更大時編碼為1,數字完全相同為0.5,數字相對更我碼為0。然後利用求和且歸一化的方法計算得到權重。比如當前有9個指標,而且都有9個指標的平均值,9個指標兩兩之間的相對大小可以進行對比,並且SPSSAU會自動建立優序圖權重計算表並且計算權重,如下表格:
上表格中數字0表示相對不重要,數字1表示相對更重要,數字0.5表示一樣重要。比如指標2的平均值為3.967,指標1的平均值是4.1,因此指標1不如指標2重要;指標4的平均值為4.3,重要性高於指標1。也或者指標7和指標9的平均得發均為4.133分,因此它們的重要性一樣,記為0.5。結合上面最關鍵的優序圖權重計算表,然後得到各個具體指標(因素)的權重值。
優序圖法適用於專家打分法,專家只需要對每個指標的重要性打分即可,然後讓軟體SPSSAU直接結合重要性打分值計算出相對重要性指標表格,最終計算得到權重。
優序圖法和AHP法的思想上基本一致,均是利用了數字的相對重要性大小計算。一般在問卷研究和專家打分時,使用AHP層次分析法或優序圖法較多。
第三類、信息量 (熵值法)
計算權重可以利用信息濃縮,也可利用數字相對重要性大小,除此之外,還可利用信息量的多少,即數據攜帶的信息量大小(物理學上的熵值原理)進行權重計算。
熵值是不確定性的一種度量。信息量越大,不確定性就越小,熵也就越小;信息量越小,不確定性越大,熵也越大。因而利用熵值攜帶的信息進行權重計算,結合各項指標的變異程度,利用信息熵這個工具,計算出各項指標的權重,為多指標綜合評價提供依據。
在實際研究中,通常情況下是先進行信息濃縮法(因子或主成分法)得到因子或主成分的權重,即得到高維度的權重,然後想得到具體每項的權重時,可使用熵值法進行計算。
SPSSAU在【綜合評價】模塊中提供此方法,其計算也較為簡單易懂,直接把分析項放在框中即可得到具體的權重值。
第四類、數據波動性或相關性 (CRITIC、獨立性和信息量權重)
可利用因子或主成分法對信息進行濃縮,也可以利用數字相對大小進行AHP或優序圖法分析得到權重,還可利用物理學上的熵值原理(即信息量攜帶多少)的方法得到權重。除此之外,數據之間的波動性大小也是一種信息,也或者數據之間的相關關系大小,也是一種信息,可利用數據波動性大小或數據相關關系大小計算權重。
1. CRITIC權重法
CRITIC權重法是一種客觀賦權法。其思想在於用兩項指標,分別是對比強度和沖突性指標。對比強度使用標准差進行表示,如果數據標准差越大說明波動越大,權重會越高;沖突性使用相關系數進行表示,如果指標之間的相關系數值越大,說明沖突性越小,那麼其權重也就越低。權重計算時,對比強度與沖突性指標相乘,並且進行歸一化處理,即得到最終的權重。使用SPSSAU時,自動會建立對比強度和沖突性指標,並且計算得到權重值。
CRITIC權重法適用於這樣一類數據,即數據穩定性可視作一種信息,並且分析的指標或因素之間有著一定的關聯關系時。比如醫院裡面的指標:出院人數、入出院診斷符合率、治療有效率、平均床位使用率、病床周轉次數共5個指標;此5個指標的穩定性是一種信息,而且此5個指標之間本身就可能有著相關性。因此CRITIC權重法剛好利用數據的波動性(對比強度)和相關性(沖突性)進行權重計算。
SPSSAU綜合評價裡面提供CRITIC權重法,如下圖所示:
2. 獨立性權重法
獨立性權重法是一種客觀賦權法。其思想在於利用指標之間的共線性強弱來確定權重。如果說某指標與其它指標的相關性很強,說明信息有著較大的重疊,意味著該指標的權重會比較低,反之如果說某指標與其它指標的相關性較弱,那麼說明該指標攜帶的信息量較大,該指標應該賦予更高的權重。
獨立性權重法僅僅只考慮了數據之間相關性,其計算方式是使用回歸分析得到的復相關系數R 值來表示共線性強弱(即相關性強弱),該值越大說明共線性越強,權重會越低。比如有5個指標,那麼指標1作為因變數,其餘4個指標作為自變數進行回歸分析,就會得到復相關系數R 值,餘下4個指標重復進行即可。計算權重時,首先得到復相關系數R 值的倒數即1/R ,然後將值進行歸一化即得到權重。
比如某企業計劃招聘5名研究崗位人員,應聘人員共有30名,企業進行了五門專業方面的筆試,並且記錄下30名應聘者的成績。由於專業課成績具有信息重疊,因此不能簡單的直接把成績加和用於評價應聘者的專業素質。因此使用獨立性權重進行計算,便於得到更加科學客觀的評價,選出最適合的應聘者。
SPSSAU綜合評價裡面提供獨立性權重法,如下圖所示:
3. 信息量權重法
信息量權重法也稱變異系數法,信息量權重法是一種客觀賦權法。其思想在於利用數據的變異系數進行權重賦值,如果變異系數越大,說明其攜帶的信息越大,因而權重也會越大,此種方法適用於專家打分、或者面試官進行面試打分時對評價對象(面試者)進行綜合評價。
比如有5個水平差不多的面試官對10個面試者進行打分,如果說某個面試官對面試者打分數據變異系數值較小,說明該面試官對所有面試者的評價都基本一致,因而其攜帶信息較小,權重也會較低;反之如果某個面試官對面試者打分數據變異系數值較大,說明該面試官對所有面試者的評價差異較大,因而其攜帶信息大,權重也會較高。
SPSSAU綜合評價裡面提供信息量權重法,如下圖所示:
對應方法的案例說明、結果解讀這里不再一一詳述,有興趣可以參考SPSSAU幫助手冊。
㈧ 熵值法步驟
(1)方法原理及適用場景
熵值法屬於一種客觀賦值法,其利用數據攜帶的信息量大小計算權重,得到較為客觀的指標權重。熵值是不確定性的一種度量,熵越小,數據攜帶的信息量越大,權重越大;相反熵越大,信息量越小,權重越小。
適用場景:熵值法廣泛應用於各個領域,對於普通問卷數據(截面數據)或面板數據均可計算。在實際研究中,通常情況下是與其他權重計算方法配合使用,如先進行因子或主成分分析得到因子或主成分的權重,即得到高維度的權重,然後再使用熵值法進行計算,想得到具體各項的權重。
(2)操作步驟
使用SPSSAU【綜合評價-熵值法】。
使用熵值法計算權重時,需將數據整理為以下格式:
(3)注意事項
熵值法的計算公式上會有取對數,因此如果小於等於0的數字取對數,則會出現null值。此種情況共有兩種辦法。
第一種:SPSSAU非負平移功能是指,如果某列(某指標)數據出現小於等於0,則讓該列數據同時加上一個『平移值』【該值為某列數據最小值的絕對值+0.01】,以便讓數據全部都大於0,因而滿足演算法要求。
第二種:研究者也可以手工查看數據並將小於等於0的數據設置為異常值,但此種做法會讓樣本減少。