導航:首頁 > 知識科普 > 計算因子得分的方法有哪些

計算因子得分的方法有哪些

發布時間:2022-12-19 09:29:26

① 16種常用的數據分析方法-因子分析


因子分析法是指從研究指標相關矩陣內部的依賴關系出發,把一些信息重疊、具有錯綜復雜關系的變數歸結為少數幾個不相關的綜合因子的一種多元統計分析方法。 


是一種旨在尋找隱藏在多變數數據中、無法直接觀察到卻影響或支配可測變數的潛在因子、並估計潛在因子對可測變數的影響程度以及潛在因子之間的相關性的一種多元統計分析方法




基本思想


根據相關性大小把變數分組,使得同組內的變數之間相關性較高,但不同組的變數不相關或相關性較低,每組變數代表一個基本結構一即公共因子。




什麼做因子分析


舉例說明:在實際門店問題中,往往我們會選擇潛力最大的門店作為領航店,以此為樣板,實現業績和利潤的突破及未來新店的標桿。選擇領航店過程中我們要注重很多因素,比如:


↘所在小區的房價

↘總面積

↘戶主年齡分布

↘小區戶數

↘門店面積

↘2公里范圍內競爭門店數量等


收集到所有的這些數據雖然能夠全面、精準的確定領航店的入選標准,但實際建模時這些變數未必能夠發揮出預期的作用。主要體現兩方面:計算量的問題;變數間的相關性問題。


這時,最簡單直接的方案就是削減變數個數,確定主要變數,因子分析以最少的信息丟失為前提,將眾多的原有變數綜合成少數的綜合指標。




因子分析特點


因子個數遠小於變數個數;


能夠反應原變數的絕大數信息;


因子之間的線性關系不顯著;


因子具有命名解釋性




因子分析步驟


1.原有變數是否能夠進行因子分析;

2.提取因子;


3.因子的命名解釋;


4.計算因子得分;五、綜合評價




因子與主成分分析的區別


相同:都能夠起到處理多個原始變數內在結構關系的作用


不同:主成分分析重在綜合原始變適的信息.而因子分析重在解釋原始變數間的關系,是比主成分分析更深入的一種多元統計方法


因子分析可以看做是優化後的主成分分析,兩種方法有很多共通的地方,但應用方面各有側重。




因子分析應用場景



因子分析方法主要用於三種場景,分別是:


l 信息濃縮 :將多個分析項濃縮成幾個關鍵概括性指標。比如將多個問卷題濃縮成幾個指標。如果偏重信息濃縮且關注指標與分析項對應關系,使用因子分析更為適合。


l 權重計算 :利用方差解釋率值計算各概括性指標的權重。在信息濃縮的基礎上,可進一步計算每個主成分/因子的權重,構建指標權重體系。


l 綜合競爭力 :利用成分得分和方差解釋率這兩項指標,計算得到綜合得分,用於綜合競爭力對比(綜合得分值越高意味著競爭力越強)。此類應用常見於經濟、管理類研究,比如上市公司的競爭實力對比。




因子分析案例


現在有 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總雇員、專業服務、中等房價),為對這 12 個地區進行綜合評價,請確定出這 12 個地區的綜合評價指標。( 綜合競爭力應用場景


同一指標在不同地區是不同的,用單一某一個指標難以對12個地區進行准確的評價,單一指標只能反映地區的某一方面。所以,有必要確定綜合評價指標,便於對比。因子分析方法就可以應用在這個案例中。


5 個指標即為我們分析的對象,我們希望從這5個可觀測指標中尋找出潛在的因素,用這些具有綜合信息的因素對各地區進行評價。


下圖spss因子分析的操作界面主要包括5方面的選項,變數區只能選擇數值型變數,分類型變數不能進入該模型。


spss軟體為了消除不同變數間量綱和數量級對結果的影響,在該過程中默認自動進行標准化處理,因此不需要對這些變數提前進行標准化處理。

 



描述統計選項卡


希望看到各變數的描述統計信息,要對比因子提取前後的方差變化,選定「單變數描述性」和「原始分析結果」;


現在是基於相關矩陣提取因子,所以,選定相關矩陣的「系數和顯著性水平「,


另外,比較重要的還有 KMO 和球形檢驗,通過KMO值,我們可以初步判斷該數據集是否適合採用因子分析方法,kmo結果有時並不會出現,這主要與變數個數和樣本量大小有關。

 

 



抽取選項卡:在該選項卡中設置如何提取因子


提取因子的方法有很多,最常用的就是主成分法。


因為參與分析的變數測度單位不同,所以選擇「相關矩陣」,如果參與分析的變數測度單位相同,則考慮選用協方差矩陣。


經常用到碎石圖對於判斷因子的個數很有幫助,一般都會選擇該項。關於特徵值,一般spss默認只提取特徵值大於1的因子。收斂次數比較重要,可以從首次結果反饋的信息進行調整。

 

 


因子旋轉選項卡


因子分析要求對因子給予命名和解釋,是否對因子旋轉取決於因子的解釋。


旋轉就是坐標變換,使得因子系數向1 和 0 靠近,對公因子的命名和解釋更加容易。旋轉方法一般採用」最大方差法「即可,輸出旋轉後的因子矩陣和載荷圖,對於結果的解釋非常有幫助。


如果不經旋轉因子已經很好解釋,那麼沒有必要旋轉,否則,應該旋轉。

 

 


保存因子得分


要計算因子得分就要先寫出因子的表達式。因子是不能直接觀察到的,是潛在的。但是可以通過可觀測到的變數獲得。


因子分析模型是原始變數為因子的線性組合,現在我們可以根據回歸的方法將模型倒過來,用原始變數也就是參與分析的變數來表示因子。從而得到因子得分。因子得分作為變數保存,對於以後深入分析很有用處。

 




結果解讀:驗證數據是否適合做因子分析


參考kmo結果,一般認為大於0.5,即可接受。同時還可以參考相關系數,一般認為分析變數的相關系數多數大於 0.3,則適合做因子分析;


KMO=0.575 檢驗來看,不是特別適合因子分析,基本可以通過。


 

 



結果解讀:因子方差表


提取因子後因子方差的值均很高,表明提取的因子能很好的描述這 5 個指標。


方差分解表表明,默認提取的前兩個因子能夠解釋 5 個指標的 93.4%。碎石圖表明,從第三個因子開始,特徵值差異很小。綜上,提取前兩個因子。


 

 

 

 



結果解讀:因子矩陣


旋轉因子矩陣可以看出,經旋轉後,因子便於命名和解釋。


因子 1主要解釋的是中等房價、專業服務項目、中等校平均校齡,可以命名為社會福利因子;


因子 2 主要解釋的是其餘兩個指標,總人口和總雇員。可以命名為人口因子。


因子分析要求最後得到的因子之間相互獨立,沒有相關性,而因子轉換矩陣顯示,兩個因子相關性較低。可見,對因子進行旋轉是完全有必要的。


 



結果解讀:因子系數


因子得分就是根據這個系數和標准化後的分析變數得到的。在數據視圖中可以看到因子得分變數。



結論


經過因子分析實現了目的,找到了兩個綜合評價指標,人口因子和福利因子。


從原來的 5 個指標挖掘出 2 個潛在的綜合因子。可以對12 個地區給出客觀評價。

 

 

 

可以根據因子1或因子2得分,對這12個地區進行從大到小排序,得分高者被認為在這個維度上有較好表現。



② 求助:spss用因子分析法 怎麼得到因子得分和排名

通過因子分析中一個選項保存因子得分,然後系統會在原數據最後保存生成3列因子得分,將假設為a1、a2、a3代表3個因子,然後根據因子分析得出三個因子的特徵根值,分別計算粗3個因子的權重,分別為各自的特徵根值/三個因子特徵根值之和。

然後綜合因子得分=a1*對應權重+a2*對應權重+a3*對應權重,之後就根據綜合因子得分進行大小排名即可。

(2)計算因子得分的方法有哪些擴展閱讀

(i)因子分析法的分析步驟

⑴確認待分析的原變數是否適合作因子分析。

⑵構造因子變數。

⑶利用旋轉方法使因子變數更具有可解釋性。

⑷計算因子變數得分。

(ii)因子分析的計算過程:

⑴將原始數據標准化,以消除變數間在數量級和量綱上的不同。

⑵求標准化數據的相關矩陣;

⑶求相關矩陣的特徵值和特徵向量;

⑷計算方差貢獻率與累積方差貢獻率;

⑸確定因子:

設F1,F2,…, Fp為p個因子,其中前m個因子包含的數據信息總量(即其累積貢獻率)不低於80%時,可取前m個因子來反映原評價指標;

⑹因子旋轉:

若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉以獲得較為明顯的實際含義。

⑺用原指標的線性組合來求各因子得分:

採用回歸估計法,Bartlett估計法或Thomson估計法計算因子得分。

⑻綜合得分

以各因子的方差貢獻率為權,由各因子的線性組合得到綜合評價指標函數。

F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )

此處wi為旋轉前或旋轉後因子的方差貢獻率。

⑼得分排序:利用綜合得分可以得到得分名次。

③ 因子分析法(FA)

3.2.1.1 技術原理

因子分析是研究相關陣或協方差陣的內部依賴關系,它將多個變數綜合為少數幾個因子,以再現原始變數與因子之間的相關關系。R型因子分析研究變數(指標)之間的相關關系,通過對變數的相關陣或協方差陣內部結構的研究,找出控制所有變數的幾個公共因子(或稱主因子、潛因子),用以對變數或樣品進行分類;Q型因子分析研究樣品之間的相關關系,通過對樣品的相似矩陣內部結構的研究找出控制所有樣品的幾個主要因素(或稱主因子)這兩種因子分析的處理方法一樣,只是出發點不同。R型從變數的相關陣出發,Q型從樣品的相似矩陣出發。對一批觀測數據,可以根據實際問題的需要來決定採用哪一種類型的因子分析。

對多變數的平面數據進行最佳綜合和簡化,即在保證數據信息丟失最少的原則下,對高維變數空間進行降維處理。可以通過下面的數學模型來表示:

地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例

式中:x1,x2,…,xi是p個原有變數,是均值為零、標准差為1的標准化變數,經過降維處理,p個變數可以綜合成m個新指標 F1,F2,…,Fm,且 x 可由 Fm線性表示出,即:x=AF+ε,其中矩陣A=(αijp×m,為因子載荷矩陣,aij統計學中稱為「權重」。

地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例

式中:A是第i個原有變數在第j個因子變數上的負荷,公共因子矩陣F=(F1,F2,…,Fm),特殊因子矩陣ε=(ε1,ε2,…,εiT,表示了原有變數不能被因子變數所解釋的部分,相當於多元回歸分析中的殘差部分。

因子載荷矩陣A中各行元素的平方和,稱為變數共同度,是全部公共因子對變數Xi的總方差所作出的貢獻,稱為公因子方差,表明xi對公共因子F1,F2,…,Fm的共同依賴程度。

地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例

因子載荷矩陣A中各列元素的平方和,記為

地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例

式中:

的統計意義與

恰好相反,

表示第j個公共因子Fj對X的所有分量x1,…,xp的總影響,稱為第j個公共因子Fj對x的貢獻,它是衡量第j個公共因子相對重要性的指標。目前用於估計A的方法主要有主因成分法、主因子解和極大似然法。

3.2.1.2 技術流程

(1)數據合理性檢驗

因子分析的應用要求原始變數之間有較強的相關關系,因此,在分析之前,首先需要對數據進行相關性分析,最簡單的方法就是計算變數之間的相關系數矩陣。如果相關系數矩陣在進行統計檢驗中,大部分都小於0.3,那麼這些變數就不適合進行因子分析。SPSS常用的統計檢驗方法有巴特利特球形檢驗、反映像相關矩陣檢驗和KMO檢驗。

巴特利特球形檢驗(Bartlett Test of Sphericity),若檢驗統計量較大,則認為原始數據間存在相關性,適合進行因子分析,否則不適合。

反映像相關矩陣檢驗(Anti-image Correlation Matrix),反映像相關矩陣中元素的絕對值比較大,那麼說明這些變數不適合做因子分析。

KMO(Kaiser Meyer Olkin)檢驗如表3.1。

表3.1 KMO檢驗標准表

(2)構造因子變數

構造因子變數的方法有很多種,如基於主成分模型的主成分分析法和基於因子分析模型的主軸因子法、極大似然法、最小二乘法等。

(3)利用旋轉使得因子變數更具有可解釋性

載荷矩陣A中某一行可能有多個aij比較大,說明某個原有變數可能同時與幾個因子有比較大的相關關系;同時載荷矩陣A中某一列中也可能有多個aij較大,說明某個因子變數可能解釋多個原變數的信息,但它只能解釋某個變數一小部分信息,不是任何一個變數的典型代表,會使某個因子變數的含義模糊不清。在實際分析中,希望對因子變數的含義有比較清楚的認識,這時,可以通過因子矩陣的旋轉來進行。旋轉的方式有正交旋轉、斜交旋轉、方差極大法,其中最常用的是方差極大法。

(4)計算因子變數的得分

計算因子得分首先將因子變數表示為原有變數的線性組合,即:

Fm=βm1x1m2x2+…+βmixi (3.5)

估計因子得分的方法有回歸法、Bar-tlette法、Anderson-Rubin 法等。默認取特徵值大於1的公因子或累計貢獻率大於85%(70%或90%)的最小正整數的因子(圖3.2)。

圖3.2 技術流程圖

3.2.1.3 適用范圍

因子分析是研究相關陣或協方差陣的內部依賴關系,它將多個變數綜合為少數幾個因子,以再現原始變數與因子之間的相關關系。FA法使用簡單,不需要研究地區優先源的監測數據,在缺乏污染源成分譜的情況下仍可解析,並可廣泛使用統計軟體處理數據。其不足之處在於需要輸入大量數據,而且只能得到各類元素對主因子的相對貢獻百分比。

④ 因子分析方法

因子分析是一種多變數化簡技術,目的是分解原始變數,從中歸納出潛在的「類別」,相關性較強的指標歸為一類,不同類間變數的相關性較低,每一類變數代表了一個「共同因子」,即一種內在結構,因子分析就是要尋找該結構。其分析方法有很多種,最常用的有兩種:一是主成分分析方法;另外一種是一般因子分析法。通常所說的因子分析指的就是一般因子分析法,它通過原始變數的方差去構造因子,一般情況下,因子的數量總是要少於變數的數量。所以對於一般因子分析而言,如何正確解釋因子將會比主成分分析更困難。

因子分析一般可以分成四步:

考察變數之間的相關性,判斷是否要進行因子分析;

進行分析,按一定的標准確定提取的因子數目,一般要求特徵值大於1;

考察因子的可解釋性,並在必要時進行因子旋轉,以尋求最佳解釋方式;

計算出因子得分等中間指標,供進一步分析使用。

利用因子分析,可以把搜集到的比較雜亂的原始數據進行壓縮,找出最重要的因子,並對其按照成因歸類、整理,從中找出幾條主線,幫助分析充滿度的主要控制因素。

本研究中共統計岩性圈閉354個,參與統計分析和計算的圈閉有249個。由於其中的落空圈閉無法參與因子分析及充滿度預測模型的建立,因此實際參與分析和預測的岩性油氣藏為222個。初步地質分析後,選取平均孔隙度,%;平均滲透率,10-3μm2;排烴強度,104t/km2;與排烴中心的平面距離,km;與排烴中心的垂直距離,m;地層壓力系數;砂體厚度,m;砂體面積,km2;有機質豐度,%;圍岩厚度,m;平均埋深,m;共11個地質參數進行因子分析。

本研究按不同的成藏體系進行,建立其充滿度預測模型並進行回代驗證。同一成藏體系內的岩性油氣藏的生、儲、蓋、圈、運、保等成藏條件相互影響、相互制約,關系密切,將同一成藏體系中的岩性油氣藏又分別劃分為構造-岩性、透鏡體油氣藏進行預測。

⑤ 因子分析法的分析步驟

因子分析的核心問題有兩個:一是如何構造因子變數;二是如何對因子變數進行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個核心問題展開的。
(i)因子分析常常有以下四個基本步驟:
⑴確認待分析的原變數是否適合作因子分析。
⑵構造因子變數。
⑶利用旋轉方法使因子變數更具有可解釋性。
⑷計算因子變數得分。
(ii)因子分析的計算過程:
⑴將原始數據標准化,以消除變數間在數量級和量綱上的不同。
⑵求標准化數據的相關矩陣;
⑶求相關矩陣的特徵值和特徵向量;
⑷計算方差貢獻率與累積方差貢獻率;
⑸確定因子:
設F1,F2,…, Fp為p個因子,其中前m個因子包含的數據信息總量(即其累積貢獻率)不低於80%時,可取前m個因子來反映原評價指標;
⑹因子旋轉:
若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉以獲得較為明顯的實際含義。
⑺用原指標的線性組合來求各因子得分:
採用回歸估計法,Bartlett估計法或Thomson估計法計算因子得分。
⑻綜合得分
以各因子的方差貢獻率為權,由各因子的線性組合得到綜合評價指標函數。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此處wi為旋轉前或旋轉後因子的方差貢獻率。
⑼得分排序:利用綜合得分可以得到得分名次。
在採用多元統計分析技術進行數據處理、建立宏觀或微觀系統模型時,需要研究以下幾個方面的問題:
· 簡化系統結構,探討系統內核。可採用主成分分析、因子分析、對應分析等方法,在眾多因素中找出各個變數最佳的子集合,從子集合所包含的信息描述多變數的系統結果及各個因子對系統的影響。「從樹木看森林」,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡化系統的結構,認識系統的內核。
· 構造預測模型,進行預報控制。在自然和社會科學領域的科研與生產中,探索多變數系統運動的客觀規律及其與外部環境的關系,進行預測預報,以實現對系統的最優控制,是應用多元統計分析技術的主要目的。在多元分析中,用於預報控制的模型有兩大類。一類是預測預報模型,通常採用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術。另一類是描述性模型,通常採用聚類分析的建模技術。
· 進行數值分類,構造分類模式。在多變數系統的分析中,往往需要將系統性質相似的事物或現象歸為一類。以便找出它們之間的聯系和內在規律性。過去許多研究多是按單因素進行定性處理,以致處理結果反映不出系統的總的特徵。進行數值分類,構造分類模式一般採用聚類分析和判別分析技術。
如何選擇適當的方法來解決實際問題,需要對問題進行綜合考慮。對一個問題可以綜合運用多種統計方法進行分析。例如一個預報模型的建立,可先根據有關生物學、生態學原理,確定理論模型和試驗設計;根據試驗結果,收集試驗資料;對資料進行初步提煉;然後應用統計分析方法(如相關分析、逐步回歸分析、主成分分析等)研究各個變數之間的相關性,選擇最佳的變數子集合;在此基礎上構造預報模型,最後對模型進行診斷和優化處理,並應用於生產實際。

⑥ 請問怎麼在SPSS中計算各維度的因子分

在SPSS中計算各維度的因子分方法如下:

  1. 分析——降維——因子分析;

  2. 自變數的題目和因變數的題目要獨立分析;

  3. 將要做分析的題目選擇到右邊的白框之後,打鉤,抽取」和「選項」兩個不用管他。然後就點「確定;

  4. 按照上述步驟操作下來之後,就可以得到結果。

因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發抽因法、拉奧典型抽因法等等。這些方法本質上大都屬近似方法,是以相關系數矩陣為基礎的,所不同的是相關系數矩陣對角線上的值,採用不同的共同性估值。在社會學研究中,因子分析常採用以主成分分析為基礎的反覆法。因子分析可在許多變數中找出隱藏的具有代表性的因子。將相同本質的變數歸入一個因子,可減少變數的數目,還可檢驗變數間關系的假設。

⑦ spss中 綜合因子得分的計算

1、進入spss表格後點擊轉換,再點擊計算變數。

(7)計算因子得分的方法有哪些擴展閱讀:

計算公式:總得分=因子1的方差貢獻率*因子1的得分+因子2的方差貢獻率*因子2的得分+......

如果要計算綜合得分,需要用每個共因子的方差貢獻率做權數,對每個因子進行加權,然後加總得到,這個以方差貢獻率為權數計算綜合得分的方法SPSS是不帶的,要自己計算。

⑧ spss19.0用因子分析法計算綜合得分(用來比較業績的),跪求大神教個詳細做法

因子分析只是一個基礎的工作,因子得分不是因子分析的最終結果,因子得分可以作為變數進行回歸分析、聚類分析、計算因子的綜合得分等等。

1、因子綜合得分在因子得分的後續運用中很是重要。沒有必要在Excel中建立計算公式,spss的功能很強大,操作見圖片。計算出後,可一再建立一個「排序」變數,按降序方法來排序。

再對scores排序即可。

閱讀全文

與計算因子得分的方法有哪些相關的資料

熱點內容
野釣的正確方法圖片 瀏覽:728
做深蹲的正確呼吸方法是什麼 瀏覽:841
燒鴨使用方法 瀏覽:137
調查對象的最佳方法 瀏覽:321
拾音器的安裝方法 瀏覽:972
a型法蘭承插式柔性連接方法 瀏覽:281
稅後工資計算方法 瀏覽:386
韓國玫瑰面膜使用方法 瀏覽:906
有框地簧門安裝方法圖解 瀏覽:676
想要讀公辦學校有哪些方法 瀏覽:169
概率密度估計方法有哪些 瀏覽:82
杭州婚姻修復方法操作步驟 瀏覽:144
沙糖桔種子種植方法 瀏覽:500
手機掉水裡的處理方法 瀏覽:649
細胞死亡的檢測方法有哪些 瀏覽:873
三彩瓷鑒別方法 瀏覽:353
水鍾的製作方法簡單 瀏覽:671
開啟手機功能的方法 瀏覽:324
如何了解消費者調查的方法 瀏覽:622
skf激光對中儀使用方法 瀏覽:173