Ⅰ 因子分析法和主成分分析法的區別與聯系是什麼
聯系:因子分析法和主成分分析法都是統計分析方法,都要對變數標准化,並找出相關矩陣。區別:在主成分分析中,最終確定的新變數是原始變數的線性組合,因子分析是要利用少數幾個公共因子去解釋較多個要觀測變數中存在的復雜關系。
1.因子分析法通過正交變換,將一組可能具有相關性的變數轉換為一組線性不相關的變數,稱為主成分。它主要用於市場研究領域。在市場研究中,研究人員關注一些研究指標的整合或組合。這些概念通常通過分數來衡量。人口學、數量地理學、分子動力學模擬、數學建模、數學分析等學科。因子分析和主成分分析都是統計分析方法,都需要對變數進行標准化,找出相關矩陣。
2.因子分析可以在許多變數中發現隱藏的代表性因素。主成分分析的原理是嘗試將原始變數重新組合成一組新的獨立綜合變數。因子分析在主成分分析的基礎上增加了一個旋轉函數。這種輪換的目的是更容易地命名和解釋因素的含義。如果研究的重點是指標與分析項目之間的對應關系,或者想要對得到的指標進行命名,建議使用因子分析。
3.主成分分析法是根據實際需要,盡量選取盡可能少的求和變數,以反映原始變數的信息。這種統計方法稱為主成分分析或主成分分析,這也是一種處理降維的數學方法。主成分分析試圖用一套新的不相關的綜合指標取代原有指標。因子分析是社會研究的有力工具,但它不能確定一項研究中有多少因素。當研究中選擇的變數發生變化時,因素的數量也會發生變化。
拓展資料:霍特林將這種方法推廣到隨機向量的情況。信息的大小通常由方差或方差的平方和來衡量。因子分析最早由英國心理學家C.E.斯皮爾曼提出。他發現學生在不同科目的成績之間有一定的相關性。一門學科成績好的學生往往在其他學科成績更好,因此他推測是否有一些潛在的共同因素或一些一般的智力條件影響學生的學業成績。
Ⅱ 16種常用的數據分析方法-因子分析
因子分析法是指從研究指標相關矩陣內部的依賴關系出發,把一些信息重疊、具有錯綜復雜關系的變數歸結為少數幾個不相關的綜合因子的一種多元統計分析方法。
是一種旨在尋找隱藏在多變數數據中、無法直接觀察到卻影響或支配可測變數的潛在因子、並估計潛在因子對可測變數的影響程度以及潛在因子之間的相關性的一種多元統計分析方法
基本思想
根據相關性大小把變數分組,使得同組內的變數之間相關性較高,但不同組的變數不相關或相關性較低,每組變數代表一個基本結構一即公共因子。
為什麼做因子分析
舉例說明:在實際門店問題中,往往我們會選擇潛力最大的門店作為領航店,以此為樣板,實現業績和利潤的突破及未來新店的標桿。選擇領航店過程中我們要注重很多因素,比如:
↘所在小區的房價
↘總面積
↘戶主年齡分布
↘小區戶數
↘門店面積
↘2公里范圍內競爭門店數量等
收集到所有的這些數據雖然能夠全面、精準的確定領航店的入選標准,但實際建模時這些變數未必能夠發揮出預期的作用。主要體現兩方面:計算量的問題;變數間的相關性問題。
這時,最簡單直接的方案就是削減變數個數,確定主要變數,因子分析以最少的信息丟失為前提,將眾多的原有變數綜合成少數的綜合指標。
因子分析特點
因子個數遠小於變數個數;
能夠反應原變數的絕大數信息;
因子之間的線性關系不顯著;
因子具有命名解釋性
因子分析步驟
1.原有變數是否能夠進行因子分析;
2.提取因子;
3.因子的命名解釋;
4.計算因子得分;五、綜合評價
因子與主成分分析的區別
相同:都能夠起到處理多個原始變數內在結構關系的作用
不同:主成分分析重在綜合原始變適的信息.而因子分析重在解釋原始變數間的關系,是比主成分分析更深入的一種多元統計方法
因子分析可以看做是優化後的主成分分析,兩種方法有很多共通的地方,但應用方面各有側重。
因子分析應用場景
因子分析方法主要用於三種場景,分別是:
l 信息濃縮 :將多個分析項濃縮成幾個關鍵概括性指標。比如將多個問卷題濃縮成幾個指標。如果偏重信息濃縮且關注指標與分析項對應關系,使用因子分析更為適合。
l 權重計算 :利用方差解釋率值計算各概括性指標的權重。在信息濃縮的基礎上,可進一步計算每個主成分/因子的權重,構建指標權重體系。
l 綜合競爭力 :利用成分得分和方差解釋率這兩項指標,計算得到綜合得分,用於綜合競爭力對比(綜合得分值越高意味著競爭力越強)。此類應用常見於經濟、管理類研究,比如上市公司的競爭實力對比。
因子分析案例
現在有 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總雇員、專業服務、中等房價),為對這 12 個地區進行綜合評價,請確定出這 12 個地區的綜合評價指標。( 綜合競爭力應用場景 )
同一指標在不同地區是不同的,用單一某一個指標難以對12個地區進行准確的評價,單一指標只能反映地區的某一方面。所以,有必要確定綜合評價指標,便於對比。因子分析方法就可以應用在這個案例中。
5 個指標即為我們分析的對象,我們希望從這5個可觀測指標中尋找出潛在的因素,用這些具有綜合信息的因素對各地區進行評價。
下圖spss因子分析的操作界面主要包括5方面的選項,變數區只能選擇數值型變數,分類型變數不能進入該模型。
spss軟體為了消除不同變數間量綱和數量級對結果的影響,在該過程中默認自動進行標准化處理,因此不需要對這些變數提前進行標准化處理。
描述統計選項卡
希望看到各變數的描述統計信息,要對比因子提取前後的方差變化,選定「單變數描述性」和「原始分析結果」;
現在是基於相關矩陣提取因子,所以,選定相關矩陣的「系數和顯著性水平「,
另外,比較重要的還有 KMO 和球形檢驗,通過KMO值,我們可以初步判斷該數據集是否適合採用因子分析方法,kmo結果有時並不會出現,這主要與變數個數和樣本量大小有關。
抽取選項卡:在該選項卡中設置如何提取因子
提取因子的方法有很多,最常用的就是主成分法。
因為參與分析的變數測度單位不同,所以選擇「相關矩陣」,如果參與分析的變數測度單位相同,則考慮選用協方差矩陣。
經常用到碎石圖對於判斷因子的個數很有幫助,一般都會選擇該項。關於特徵值,一般spss默認只提取特徵值大於1的因子。收斂次數比較重要,可以從首次結果反饋的信息進行調整。
因子旋轉選項卡
因子分析要求對因子給予命名和解釋,是否對因子旋轉取決於因子的解釋。
旋轉就是坐標變換,使得因子系數向1 和 0 靠近,對公因子的命名和解釋更加容易。旋轉方法一般採用」最大方差法「即可,輸出旋轉後的因子矩陣和載荷圖,對於結果的解釋非常有幫助。
如果不經旋轉因子已經很好解釋,那麼沒有必要旋轉,否則,應該旋轉。
保存因子得分
要計算因子得分就要先寫出因子的表達式。因子是不能直接觀察到的,是潛在的。但是可以通過可觀測到的變數獲得。
因子分析模型是原始變數為因子的線性組合,現在我們可以根據回歸的方法將模型倒過來,用原始變數也就是參與分析的變數來表示因子。從而得到因子得分。因子得分作為變數保存,對於以後深入分析很有用處。
結果解讀:驗證數據是否適合做因子分析
參考kmo結果,一般認為大於0.5,即可接受。同時還可以參考相關系數,一般認為分析變數的相關系數多數大於 0.3,則適合做因子分析;
KMO=0.575 檢驗來看,不是特別適合因子分析,基本可以通過。
結果解讀:因子方差表
提取因子後因子方差的值均很高,表明提取的因子能很好的描述這 5 個指標。
方差分解表表明,默認提取的前兩個因子能夠解釋 5 個指標的 93.4%。碎石圖表明,從第三個因子開始,特徵值差異很小。綜上,提取前兩個因子。
結果解讀:因子矩陣
旋轉因子矩陣可以看出,經旋轉後,因子便於命名和解釋。
因子 1主要解釋的是中等房價、專業服務項目、中等校平均校齡,可以命名為社會福利因子;
因子 2 主要解釋的是其餘兩個指標,總人口和總雇員。可以命名為人口因子。
因子分析要求最後得到的因子之間相互獨立,沒有相關性,而因子轉換矩陣顯示,兩個因子相關性較低。可見,對因子進行旋轉是完全有必要的。
結果解讀:因子系數
因子得分就是根據這個系數和標准化後的分析變數得到的。在數據視圖中可以看到因子得分變數。
結論
經過因子分析實現了目的,找到了兩個綜合評價指標,人口因子和福利因子。
從原來的 5 個指標挖掘出 2 個潛在的綜合因子。可以對12 個地區給出客觀評價。
可以根據因子1或因子2得分,對這12個地區進行從大到小排序,得分高者被認為在這個維度上有較好表現。
Ⅲ 因子分析概念
在各個領域的科學研究中,往往需要對反映事物的多個變數進行大量的觀測並收集大量數據,以便分析尋找規律。多變數大樣本無疑會為科學研究提供豐富的信息,但也在一定程度上增加了數據採集的工作量,更重要的是在大多數情況下,許多變數之間可能存在的相關性增加了問題分析的復雜性,同時對分析帶來不便。如果分別分析每個指標,分析又可能是孤立的,而不是綜合的。盲目減少指標會損失很多信息,產生錯誤的結論。因此需要找到一個合理的方法,在減少分析指標的同時,盡量減少原指標包含信息的損失,對所收集的資料作全面的分析。由於各變數間存在一定的相關關系,因此用較少的指標分別綜合存在於各變數中的各類信息,這少數幾個綜合指標彼此不相關,即所代表的信息是不重疊的,通常稱為因子,因子分析法因此得名。因此,因子分析是將多個實測變數轉換為少數幾個不相關的綜合指標的多元統計分析方法(於志鈞等,1984;趙旭東,1992;陸明德,1991)。
因子分析方法由Spearman在19世紀初研究心理學問題時提出,1957年由Krumbein引入地質學,後來Imbrie對因子分析在地質學中的應用和發展做了大量工作。
因子分析可以從以下幾個方面為地質研究提供幫助:①壓縮原始數據。因子分析為眾多復雜的地質數據精簡提供了一種數學演算法,它能在數量上大大精簡原始數據但又不損失數據中包含的成因信息,這樣就有利於地質人員進行綜合分析。②指示成因推理方向。因子分析能夠把龐雜紛亂的原始數據按成因上的聯系進行歸納、整理、精煉和分類,理出幾條客觀的成因線索,為地質人員提供邏輯推理方向,啟發思考相應的成因結論。③分解疊加的地質過程。現實中觀測到的地質現象往往是多種成因過程疊加的產物,因子分析提供了一個分解疊加過程而識別每個單一地質過程的手段。
鑒於上述原因,因子分析在地學領域的應用十分廣泛,已有效地應用於沉積盆地蝕源區的研究、沉積物的粒度分析、沉積相研究、地層分析、古環境與古生態的研究、石油及天然氣成因研究、油田水化學研究、有機地球化學研究及石油、天然氣化探資料分析等各個方面(曾濺輝等,2002;張俊,2005;陳科貴等,2006)。
Ⅳ 關於spss效度分析,因子分析
1,這是因子分析的第一步。你的kmo大於0.5,sig小於0.05,說明你的數據可以做因子分析。也就 是說你緊跟在下邊的報表是有意義的。
2,效度分析要看旋轉矩陣,這個問題很復雜,建議你找一下旋轉矩陣怎麼看的資料學習一下。
總之你的維度要在選轉矩陣上分開,這樣效度就通過了,
3,近似卡方值和自由度不用管。
ppv課學習網站
Ⅳ 因子分析法(FA)
3.2.1.1 技術原理
因子分析是研究相關陣或協方差陣的內部依賴關系,它將多個變數綜合為少數幾個因子,以再現原始變數與因子之間的相關關系。R型因子分析研究變數(指標)之間的相關關系,通過對變數的相關陣或協方差陣內部結構的研究,找出控制所有變數的幾個公共因子(或稱主因子、潛因子),用以對變數或樣品進行分類;Q型因子分析研究樣品之間的相關關系,通過對樣品的相似矩陣內部結構的研究找出控制所有樣品的幾個主要因素(或稱主因子)這兩種因子分析的處理方法一樣,只是出發點不同。R型從變數的相關陣出發,Q型從樣品的相似矩陣出發。對一批觀測數據,可以根據實際問題的需要來決定採用哪一種類型的因子分析。
對多變數的平面數據進行最佳綜合和簡化,即在保證數據信息丟失最少的原則下,對高維變數空間進行降維處理。可以通過下面的數學模型來表示:
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
式中:x1,x2,…,xi是p個原有變數,是均值為零、標准差為1的標准化變數,經過降維處理,p個變數可以綜合成m個新指標 F1,F2,…,Fm,且 x 可由 Fm線性表示出,即:x=AF+ε,其中矩陣A=(αij)p×m,為因子載荷矩陣,aij統計學中稱為「權重」。
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
式中:A是第i個原有變數在第j個因子變數上的負荷,公共因子矩陣F=(F1,F2,…,Fm),特殊因子矩陣ε=(ε1,ε2,…,εi)T,表示了原有變數不能被因子變數所解釋的部分,相當於多元回歸分析中的殘差部分。
因子載荷矩陣A中各行元素的平方和,稱為變數共同度,是全部公共因子對變數Xi的總方差所作出的貢獻,稱為公因子方差,表明xi對公共因子F1,F2,…,Fm的共同依賴程度。
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
因子載荷矩陣A中各列元素的平方和,記為
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
式中:
3.2.1.2 技術流程
(1)數據合理性檢驗
因子分析的應用要求原始變數之間有較強的相關關系,因此,在分析之前,首先需要對數據進行相關性分析,最簡單的方法就是計算變數之間的相關系數矩陣。如果相關系數矩陣在進行統計檢驗中,大部分都小於0.3,那麼這些變數就不適合進行因子分析。SPSS常用的統計檢驗方法有巴特利特球形檢驗、反映像相關矩陣檢驗和KMO檢驗。
巴特利特球形檢驗(Bartlett Test of Sphericity),若檢驗統計量較大,則認為原始數據間存在相關性,適合進行因子分析,否則不適合。
反映像相關矩陣檢驗(Anti-image Correlation Matrix),反映像相關矩陣中元素的絕對值比較大,那麼說明這些變數不適合做因子分析。
KMO(Kaiser Meyer Olkin)檢驗如表3.1。
表3.1 KMO檢驗標准表
(2)構造因子變數
構造因子變數的方法有很多種,如基於主成分模型的主成分分析法和基於因子分析模型的主軸因子法、極大似然法、最小二乘法等。
(3)利用旋轉使得因子變數更具有可解釋性
載荷矩陣A中某一行可能有多個aij比較大,說明某個原有變數可能同時與幾個因子有比較大的相關關系;同時載荷矩陣A中某一列中也可能有多個aij較大,說明某個因子變數可能解釋多個原變數的信息,但它只能解釋某個變數一小部分信息,不是任何一個變數的典型代表,會使某個因子變數的含義模糊不清。在實際分析中,希望對因子變數的含義有比較清楚的認識,這時,可以通過因子矩陣的旋轉來進行。旋轉的方式有正交旋轉、斜交旋轉、方差極大法,其中最常用的是方差極大法。
(4)計算因子變數的得分
計算因子得分首先將因子變數表示為原有變數的線性組合,即:
Fm=βm1x1+βm2x2+…+βmixi (3.5)
估計因子得分的方法有回歸法、Bar-tlette法、Anderson-Rubin 法等。默認取特徵值大於1的公因子或累計貢獻率大於85%(70%或90%)的最小正整數的因子(圖3.2)。
圖3.2 技術流程圖
3.2.1.3 適用范圍
因子分析是研究相關陣或協方差陣的內部依賴關系,它將多個變數綜合為少數幾個因子,以再現原始變數與因子之間的相關關系。FA法使用簡單,不需要研究地區優先源的監測數據,在缺乏污染源成分譜的情況下仍可解析,並可廣泛使用統計軟體處理數據。其不足之處在於需要輸入大量數據,而且只能得到各類元素對主因子的相對貢獻百分比。
Ⅵ 什麼是spss因子分析方法
因子分析
1輸入數據。
2點Analyze 下拉菜單,選Data Rection 下的Factor 。
3打開Factor Analysis後,將數據變數逐個選中進入Variables 對話框中。
4單擊主對話框中的Descriptive按扭,打開Factor Analysis: Descriptives子對話框,在Statistics欄中選擇Univariate Descriptives項要求輸出個變數的均值與標准差,在Correlation Matrix 欄內選擇Coefficients項,要求計算相關系數矩陣,單擊Continue按鈕返回Factor Analysis主對話框。
5單擊主對話框中的Extraction 按鈕,打開如下圖所示的Factor Analysis: Extraction 子對話框。在Method列表中選擇默認因子抽取方法——Principal Components,在Analyze 欄中選擇默認的Correlation Matrix 項要求從相關系數矩陣出發求解主成分,在Exact 欄中選擇Number of Factors;6, 要求顯示所有主成分的得分和所能解釋的方差。單擊Continue按鈕返回Factor Analysis主對話框。
6單擊主對話框中的OK 按鈕,輸出結果。
統計專業研究生工作室原創,請勿復雜粘貼
Ⅶ 因子分析法的概念
1.主成分分析
主成分分析主要是一種探索性的技術,在分析者進行多元數據分析之前,用他來分析數據,讓自己對數據有一個大致的了解,這是非常有必要的。主成分分析一般很少單獨使用:a、了解數據。(screening the data),b、和cluster analysis(聚類分析)一起使用,c、和判別分析一起使用,比如當變數很多,個案數不多,直接使用判別分析可能無解,這時候可以使用主成分對變數簡化(rece dimensionality),d、在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數),還可以用來處理共線性。
1、因子分析中是把變數表示成各因子的線性組合,而主成分分析中則是把主成分表示成各變數的線性組合。
2、主成分分析的重點在於解釋各變數的總方差,而因子分析則把重點放在解釋各變數之間的協方差。
3、主成分分析中不需要有假設(assumptions),因子分析則需要一些假設。因子分析的假設包括:各個共同因子之間不相關,特殊因子(specific factor)之間也不相關,共同因子和特殊因子之間也不相關。
4、主成分分析中,當給定的協方差矩陣或者相關矩陣的特徵值是唯一的時候,主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉得到不同的因子。
5、在因子分析中,因子個數需要分析者指定(spss根據一定的條件自動設定,只要是特徵值大於1的因子進入分析),而指定的因子數量不同而結果不同。在主成分分析中,成分的數量是一定的,一般有幾個變數就有幾個主成分。和主成分分析相比,由於因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優勢。大致說來,當需要尋找潛在的因子,並對這些因子進行解釋的時候,更加傾向於使用因子分析,並且藉助旋轉技術幫助更好解釋。而如果想把現有的變數變成少數幾個新的變數(新的變數幾乎帶有原來所有變數的信息)來進入後續的分析,則可以使用主成分分析。當然,這種情況也可以使用因子得分做到。所以這種區分不是絕對的。
在演算法上,主成分分析和因子分析很類似,不過在因子分析中所採用的協方差矩陣的對角元素不再是變數的方差,而是和變數對應的共同度(變數方差中被各因子所解釋的部分)。
2.聚類分析(Cluster Analysis)
聚類分析是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類的分析技術。
在市場研究領域,聚類分析主要應用方面是幫助我們尋找目標消費群體,運用這項研究技術,我們可以劃分出產品的細分市場,並且可以描述出各細分市場的人群特徵,以便於客戶可以有針對性的對目標消費群體施加影響,合理地開展工作。
3.判別分析(Discriminatory Analysis)
判別分析(Discriminatory Analysis)的任務是根據已掌握的1批分類明確的樣品,建立較好的判別函數,使產生錯判的事例最少,進而對給定的1個新樣品,判斷它來自哪個總體。根據資料的性質,分為定性資料的判別分析和定量資料的判別分析;採用不同的判別准則,又有費歇、貝葉斯、距離等判別方法。
費歇(FISHER)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個適當的投影軸,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內的投影值所形成的類內離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。貝葉斯(BAYES)判別思想是根據先驗概率求出後驗概率,並依據後驗概率分布作出統計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂後驗概率,就是根據具體資料、先驗概率、特定的判別規則所計算出來的概率。它是對先驗概率修正後的結果。
距離判別思想是根據各樣品與各母體之間的距離遠近作出判別。即根據資料建立關於各母體的距離判別函數式,將各樣品數據逐一代入計算,得出各樣品與各母體之間的距離值,判樣品屬於距離值最小的那個母體。
4.對應分析(Correspondence Analysis)
對應分析是一種用來研究變數與變數之間聯系緊密程度的研究技術。
運用這種研究技術,我們可以獲取有關消費者對產品品牌定位方面的圖形,從而幫助您及時調整營銷策略,以便使產品品牌在消費者中能樹立起正確的形象。
這種研究技術還可以用於檢驗廣告或市場推廣活動的效果,我們可以通過對比廣告播出前或市場推廣活動前與廣告播出後或市場推廣活動後消費者對產品的不同認知圖來看出廣告或市場推廣活動是否成功的向消費者傳達了需要傳達的信息。
5.典型相關分析
典型相關分析是分析兩組隨機變數間線性密切程度的統計方法,是兩變數間線性相關分析的拓廣。各組隨機變數中既可有定量隨機變數,也可有定性隨機變數(分析時須F6說明為定性變數)。本法還可以用於分析高維列聯表各邊際變數的線性關系。
注意
1.嚴格地說,一個典型相關系數描述的只是一對典型變數之間的相關,而不是兩個變數組之間的相關。而各對典型變數之間構成的多維典型相關才共同揭示了兩個觀測變數組之間的相關形式。
2.典型相關模型的基本假設和數據要求
要求兩組變數之間為線性關系,即每對典型變數之間為線性關系;
每個典型變數與本組所有觀測變數的關系也是線性關系。如果不是線性關系,可先線性化:如經濟水平和收入水平與其他一些社會發展水之間並不是線性關系,可先取對數。即log經濟水平,log收入水平。
3.典型相關模型的基本假設和數據要求
所有觀測變數為定量數據。同時也可將定性數據按照一定形式設為虛擬變數後,再放入典型相關模型中進行分析。
6.多維尺度分析(Multi-dimension Analysis)
多維尺度分析(Multi-dimension Analysis) 是市場研究的一種有力手段,它可以通過低維空間(通常是二維空間)展示多個研究對象(比如品牌)之間的聯系,利用平面距離來反映研究對象之間的相似程度。由於多維尺度分析法通常是基於研究對象之間的相似性(距離)的,只要獲得了兩個研究對象之間的距離矩陣,我們就可以通過相應統計軟體做出他們的相似性知覺圖。
在實際應用中,距離矩陣的獲得主要有兩種方法:一種是採用直接的相似性評價,先將所有評價對象進行兩兩組合,然後要求被訪者所有的這些組合間進行直接相似性評價,這種方法我們稱之為直接評價法;另一種為間接評價法,由研究人員根據事先經驗,找出影響人們評價研究對象相似性的主要屬性,然後對每個研究對象,讓被訪者對這些屬性進行逐一評價,最後將所有屬性作為多維空間的坐標,通過距離變換計算對象之間的距離。
多維尺度分析的主要思路是利用對被訪者對研究對象的分組,來反映被訪者對研究對象相似性的感知,這種方法具有一定直觀合理性。同時該方法實施方便,調查中被訪者負擔較小,很容易得到理解接受。當然,該方法的不足之處是犧牲了個體距離矩陣,由於每個被訪者個體的距離矩陣只包含1與0兩種取值,相對較為粗糙,個體距離矩陣的分析顯得比較勉強。但這一點是完全可以接受的,因為對大多數研究而言,我們並不需要知道每一個體的空間知覺圖。
多元統計分析是統計學中內容十分豐富、應用范圍極為廣泛的一個分支。在自然科學和社會科學的許多學科中,研究者都有可能需要分析處理有多個變數的數據的問題。能否從表面上看起來雜亂無章的數據中發現和提煉出規律性的結論,不僅對所研究的專業領域要有很好的訓練,而且要掌握必要的統計分析工具。對實際領域中的研究者和高等院校的研究生來說,要學習掌握多元統計分析的各種模型和方法,手頭有一本好的、有長久價值的參考書是非常必要的。這樣一本書應該滿足以下條件:首先,它應該是「淺入深出」的,也就是說,既可供初學者入門,又能使有較深基礎的人受益。其次,它應該是既側重於應用,又兼顧必要的推理論證,使學習者既能學到「如何」做,而且在一定程度上了解「為什麼」這樣做。最後,它應該是內涵豐富、全面的,不僅要基本包括各種在實際中常用的多元統計分析方法,而且還要對現代統計學的最新思想和進展有所介紹、交代。
主成分分析通過線性組合將原變數綜合成幾個主成分,用較少的綜合指標來代替原來較多的指標(變數)。在多變數分析中,某些變數間往往存在相關性。是什麼原因使變數間有關聯呢?是否存在不能直接觀測到的、但影響可觀測變數變化的公共因子?因子分析法(Factor Analysis)就是尋找這些公共因子的模型分析方法,它是在主成分的基礎上構築若干意義較為明確的公因子,以它們為框架分解原變數,以此考察原變數間的聯系與區別。
例如,隨著年齡的增長,兒童的身高、體重會隨著變化,具有一定的相關性,身高和體重之間為何會有相關性呢?因為存在著一個同時支配或影響著身高與體重的生長因子。那麼,我們能否通過對多個變數的相關系數矩陣的研究,找出同時影響或支配所有變數的共性因子呢?因子分析就是從大量的數據中「由表及裡」、「去粗取精」,尋找影響或支配變數的多變數統計方法。
可以說,因子分析是主成分分析的推廣,也是一種把多個變數化為少數幾個綜合變數的多變數分析方法,其目的是用有限個不可觀測的隱變數來解釋原始變數之間的相關關系。
因子分析主要用於:1、減少分析變數個數;2、通過對變數間相關關系探測,將原始變數進行分類。即將相關性高的變數分為一組,用共性因子代替該組變數。
Ⅷ 什麼是因子分析法
因子分析法是指研究從變數群中提取共性因子的統計技術。因子分析可在許多變數中找出隱藏的具有代表性的因子。將相同本質的變數歸入一個因子,可減少變數的數目,還可檢驗變數間關系的假設。
在市場調研中,研究人員關心的是一些研究指標的集成或者組合,這些概念通常是通過等級評分問題來測量的,如利用李克特量表取得的變數。每一個指標的集合(或一組相關聯的指標)就是一個因子,指標概念等級得分就是因子得分。
因子分析在市場調研中有著廣泛的應用,主要包括:
(1)消費者習慣和態度研究(U&A)
(2) 品牌形象和特性研究
(3)服務質量調查
(4) 個性測試
(5)形象調查
(6) 市場劃分識別
(7)顧客、產品和行為分類
在實際應用中,通過因子得分可以得出不同因子的重要性指標,而管理者則可根據這些指標的重要性來決定首先要解決的市場問題或產品問題。
Ⅸ 因子分析方法
因子分析是一種多變數化簡技術,目的是分解原始變數,從中歸納出潛在的「類別」,相關性較強的指標歸為一類,不同類間變數的相關性較低,每一類變數代表了一個「共同因子」,即一種內在結構,因子分析就是要尋找該結構。其分析方法有很多種,最常用的有兩種:一是主成分分析方法;另外一種是一般因子分析法。通常所說的因子分析指的就是一般因子分析法,它通過原始變數的方差去構造因子,一般情況下,因子的數量總是要少於變數的數量。所以對於一般因子分析而言,如何正確解釋因子將會比主成分分析更困難。
因子分析一般可以分成四步:
考察變數之間的相關性,判斷是否要進行因子分析;
進行分析,按一定的標准確定提取的因子數目,一般要求特徵值大於1;
考察因子的可解釋性,並在必要時進行因子旋轉,以尋求最佳解釋方式;
計算出因子得分等中間指標,供進一步分析使用。
利用因子分析,可以把搜集到的比較雜亂的原始數據進行壓縮,找出最重要的因子,並對其按照成因歸類、整理,從中找出幾條主線,幫助分析充滿度的主要控制因素。
本研究中共統計岩性圈閉354個,參與統計分析和計算的圈閉有249個。由於其中的落空圈閉無法參與因子分析及充滿度預測模型的建立,因此實際參與分析和預測的岩性油氣藏為222個。初步地質分析後,選取平均孔隙度,%;平均滲透率,10-3μm2;排烴強度,104t/km2;與排烴中心的平面距離,km;與排烴中心的垂直距離,m;地層壓力系數;砂體厚度,m;砂體面積,km2;有機質豐度,%;圍岩厚度,m;平均埋深,m;共11個地質參數進行因子分析。
本研究按不同的成藏體系進行,建立其充滿度預測模型並進行回代驗證。同一成藏體系內的岩性油氣藏的生、儲、蓋、圈、運、保等成藏條件相互影響、相互制約,關系密切,將同一成藏體系中的岩性油氣藏又分別劃分為構造-岩性、透鏡體油氣藏進行預測。