① spss分析方法-因子分析(轉載)
因子分析就是將大量的彼此可能存在相關關系的變數,轉換成較少的彼此不相關的綜合指標的多元統計方法。。 下面我們主要從下面四個方面來解說:
[if !supportLineBreakNewLine]
[endif]
實際應用
理論思想
建立模型
[if !supportLineBreakNewLine]
[endif]
分析結果
[if !supportLineBreakNewLine]
[endif]
一、實際應用
在市場調研中,研究人員關心的是一些研究指標的集成或者組合,這些概念通常是通過等級評分問題來測量的,如利用李克特量表取得的變數。每一個指標的集合(或一組相關聯的指標)就是一個因子,指標概念等級得分就是因子得分。因子分析在市場調研中有著廣泛的應用,主要包括:(1)消費者習慣和態度研究(U&A)(2) 品牌形象和特性研究(3)服務質量調查(4) 個性測試(5)形象調查(6) 市場劃分識別(7)顧客、產品和行為分類在實際應用中,通過因子得分可以得出不同因子的重要性指標,而管理者則可根據這些指標的重要性來決定首先要解決的市場問題或產品問題。
[if !supportLineBreakNewLine]
[endif]
二、理論思想
因子分析(Factor Analysis)是一種數據簡化的技術。它通過研究眾多變數之間的內部依賴關系,探求觀測數據中的基本結構,並用少數幾個獨立的不可觀測變數來表示其基本的數據結構。這幾個假想變數能夠反映原來眾多變數的主要信息。原始的變數是可觀測的顯式變數,而假想變數是不可觀測的潛在變數,稱為因子。主成分分析利用的是「降維」的思想,利用原始變數的線性組合組成主成分。在信息損失較小的前提下,把多個指標轉化為幾個互補相關的綜合指標。因子分析是主成分分析的擴展和推廣,通過對原始變數的相關系數矩陣內部結構的研究,導出能控制所有變數的少數幾個不可觀測的綜合變數,通過這少數幾個綜合變數去描述原始的多個變數之間的相關關系。。
[if !supportLineBreakNewLine]
[endif]
因子分析的數學模型可以表示為Xp×1=Ap×m·Fm×1+ep×1,其中X為可實測的p維隨機向量,它的每個分量代表一個指標或變數。
F=(F1, F2,...,Fm)T為不可觀測的m維隨機向量,它的各個分量將出現在每個變數之中,所以稱它們為公共因子。矩陣A稱為因子載荷矩陣,矩陣中的每一個元素稱為因子載荷,表示第i個變數在第j個公共因子上的載荷,它們需要由多次觀測X所得到的樣本來估計。
向量e稱為特殊因子,其中包括隨機誤差,它們滿足條件:
(1)Cov(F,e)=0,即F與e不相關。
(2)Cov(Fi,Fj)=0,i≠j ,Var(Fi)=Cov(Fi, Fj)=I ,即向量F的協方差矩陣為m階單位陣。(
3)Cov(ei,ej)=0,i≠j ,Var(ei)=σi2,即向量e的協方差矩陣為p階對角陣。因子分析的基本思想是通過變數的相關系數矩陣內部結構的分析,從中找出少數幾個能控制原始變數的隨機變數Fi(i=1,2,...,m),選取公共因子的原則是使盡可能多地包含原始變數中的信息,建立模型X=A· F+e ,忽略e,以F代替X,用它再現原始變數X的眾多分量之間的相關關系,達到簡化變數降低維數的目的。
[if !supportLineBreakNewLine]
[endif]
三、建立模型
[if !supportLineBreakNewLine]
[endif]
因子分析的基本步驟如下。
對數據進行標准化處理,
估計因子載荷矩陣,
因子旋轉,建立因子分析數學模型的目的不僅要找出公共因子並對變數進行分組,更重要的是要知道每個公共因子的意義,以便對實際問題作出科學分析。當因子載荷矩陣A的結構不便對主因子進行解釋時,可用一個正交陣右乘A(即對A實施一個正交變換)。由線性代數知識,對A施行一個正交變換,對應坐標系就有一次旋轉,便於對因子的意義進行解釋。
估計因子得分以公共因子表示原因變數的線性組合,而得到因子得分函數。我們可以通過因子得分函數計算觀測記錄在各個公共因子上的得分,從而解決公共因子不可觀測的問題。
[if !supportLineBreakNewLine]
[endif]
因子分析案例:
[if !supportLineBreakNewLine]
[endif]
題目:以下給出了中國歷年國民經濟主要指標統計(1992~2000)數據。試用因子分析對這些指標提取公因子並寫出提取的公因子與這些指標之間的表達式。
一、數據輸入
二、操作步驟 1、進入SPSS,打開相關數據文件,選擇「分析」|「降維」|「因子」命令。2、選擇進行因子分析的變數。在對話框的左側列表框中,依次選擇「工業總產值」「國內生產總值」「貨物周轉量」「原煤」「發電量」「原油」進入「變數」列表框。
3、選擇輸出系數相關矩陣。
單擊「因子分析」對話框中的「描述」按鈕,彈出「因子分析:描述」對話框。在「相關性矩陣」選項組中選中「KMO和巴特利特的球形度檢驗」復選框,單擊「繼續」按鈕返回「因子分析」對話框。
4、設置對提取公因子的要求及相關輸出內容。
單擊「因子分析」對話框中的「提取」按鈕,在「輸出」選項組中選中「碎石圖」復選框。
5、設置因子旋轉方法。單擊「因子分析」對話框中的「旋轉」按鈕,在「方法」選項組中選中「最大方差法」單選按鈕。
6、設置有關因子得分的選項。單擊「得分」按鈕,選中「顯示因子得分系數矩陣」復選框。
7、其餘設置採用系統默認值即可。單擊「確定」按鈕,等待輸出結果。
[if !supportLineBreakNewLine]
[endif]
四、結果分析
1、KMO檢驗和巴特利特檢驗結果KMO檢驗是為了看數據是否適合進行因子分析,其取值范圍是0~1。其中0.9~1表示極好,0.8~0.9表示可獎勵的,0.7~0.8表示還好,0.6~0.7表示中等,0.5~0.6表示糟糕,0~0.5表示不可接受。如下表所示,本例中KMO的取值為0.657,表明可以進行因子分析。巴特利特檢驗是為了看數據是否來自於服從多元正態分布的總體。本例中顯著性值為0.000,說明數據來自正態分布總體,適合進一步分析。
2、變數共同度變數共同度表示的是各變數中所含原始信息能被提取的公因子所解釋的程度。如下表所示,因為本例中所有變數共同度都在85%以上,所以提取的這幾個公因子對各變數的解釋能力很強。
3
4、碎石圖有兩個成分的特徵值超過了1,只考慮這兩個成分即可。
5、旋轉成分矩陣第一個因子在工業總產值、國內生產總值、貨物周轉量、發電量及原油上有較大的載荷,所以其反映的是除原煤以外的其他變數的信息,第二個因子在原煤這一變數上有較大的載荷,反映的是原煤這一變數的信息。
6、成分得分系數矩陣給出了成分得分系數矩陣,據此可以直接寫出各公因子的表達式。值得一提的是,在表達式中各個變數已經不是原始變數而是標准化變數。表達式如下:F1=0.194*工業總產值+0.216*國內生產總值+0.206*貨物周轉量+0.003*原煤+0.211*發電量+0.212*原油F2=0.311*工業總產值-0.002*國內生產總值-0.154*貨物周轉量+0.853*原煤-0.124*發電量+0.036*原油
分析結論:
[if !supportLineBreakNewLine]
[endif]
通過分析,我們可以知道:
由結果分析1、知,本例很適合使用因子分析。
由結果分析2、3、4可知,本例適合選前兩個公因子進行分析,因為這已足夠替代原來的變數,它們幾乎涵蓋了原變數的全部信息。
結果分析5給出了本例中的兩個公因子及其所反映的變數。
結果分析6給出了公因子與標准化形式的變數之間的表達式。
[if !supportLineBreakNewLine]
[endif]
參考案例數據:
[if !supportLineBreakNewLine]
[endif]
[if !supportLists]【1】 [endif]spss統計分析與行業應用案例詳解(第四版) 楊維忠,張甜,王國平 清華大學出版社
[if !supportLists]【2】 [endif](獲取更多知識,前往gz號程式解說)
原文來自 https://mp.weixin.qq.com/s/5b-rkSherOn-tHyzBZPsTw