1. 因子分析法和主成分分析法的區別與聯系是什麼
聯系:因子分析法和主成分分析法都是統計分析方法,都要對變數標准化,並找出相關矩陣。區別:在主成分分析中,最終確定的新變數是原始變數的線性組合,因子分析是要利用少數幾個公共因子去解釋較多個要觀測變數中存在的復雜關系。
1.因子分析法通過正交變換,將一組可能具有相關性的變數轉換為一組線性不相關的變數,稱為主成分。它主要用於市場研究領域。在市場研究中,研究人員關注一些研究指標的整合或組合。這些概念通常通過分數來衡量。人口學、數量地理學、分子動力學模擬、數學建模、數學分析等學科。因子分析和主成分分析都是統計分析方法,都需要對變數進行標准化,找出相關矩陣。
2.因子分析可以在許多變數中發現隱藏的代表性因素。主成分分析的原理是嘗試將原始變數重新組合成一組新的獨立綜合變數。因子分析在主成分分析的基礎上增加了一個旋轉函數。這種輪換的目的是更容易地命名和解釋因素的含義。如果研究的重點是指標與分析項目之間的對應關系,或者想要對得到的指標進行命名,建議使用因子分析。
3.主成分分析法是根據實際需要,盡量選取盡可能少的求和變數,以反映原始變數的信息。這種統計方法稱為主成分分析或主成分分析,這也是一種處理降維的數學方法。主成分分析試圖用一套新的不相關的綜合指標取代原有指標。因子分析是社會研究的有力工具,但它不能確定一項研究中有多少因素。當研究中選擇的變數發生變化時,因素的數量也會發生變化。
拓展資料:霍特林將這種方法推廣到隨機向量的情況。信息的大小通常由方差或方差的平方和來衡量。因子分析最早由英國心理學家C.E.斯皮爾曼提出。他發現學生在不同科目的成績之間有一定的相關性。一門學科成績好的學生往往在其他學科成績更好,因此他推測是否有一些潛在的共同因素或一些一般的智力條件影響學生的學業成績。
2. 因子分析法和主成分分析法的區別與聯系
一、方式不同:
1、因子分析法:
通過從變數群中提取共性因子
2、主成分分析法:
通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數叫主成分。
二、應用不同:
1、因子分析法:
主要應用於市場調研領域,在市場調研中,研究人員關心的是一些研究指標的集成或者組合,這些概念通常是通過等級評分問題來測量的。
2、主成分分析法:
人口統計學、數量地理學、分子動力學模擬、數學建模、數理分析等學科中均有應用。
三、聯系:
因子分析法和主成分分析法都是統計分析方法,都要對變數標准化,並找出相關矩陣。
(2)因子分析的三種方法主因子分析法擴展閱讀
主成分分析首先是由K.皮爾森(Karl Pearson)對非隨機變數引入的,爾後H.霍特林將此方法推廣到隨機向量的情形。信息的大小通常用離差平方和或方差來衡量。
因子分析法最早由英國心理學家C.E.斯皮爾曼提出。他發現學生的各科成績之間存在著一定的相關性,一科成績好的學生,往往其他各科成績也比較好,從而推想是否存在某些潛在的共性因子,或稱某些一般智力條件影響著學生的學習成績。因子分析可在許多變數中找出隱藏的具有代表性的因子。
3. 因子分析可分為哪三個步驟
職務分析是一項技術性很強的工作,需要做周密的准備。同時還需具有與人力資源管理活動相匹配的科學的、合理的操作程序。 (一)准備階段 1、建立工作分析小組。小組成員通常由分析專家構成。所謂分析專家,是指具有分析專長,並對組織結構及組織內各項工作有明確概念的人員。一旦小組成員確定之後,賦予他們進行分析活動的許可權,以保證分析工作的協調和順利進行。 2、明確工作分析的總目標、總任務。根據總目標、總任務,對企業現狀進行初步了解,掌握各種數據和資料。 3、明確工作分析的目的。有了明確的目的,才能正確確定分析的范圍、對象和內容,規定分析的方式、方法,並弄清應當收集什麼資料,到哪兒去收集,用什麼方法去收集。 4、明確分析對象。為保證分析結果的正確性,應該選擇有代表性、典型性的工作。 5、建立良好的工作關系。為了搞好工作分析,還應做好員工的心理准備工作,建立起友好的合作關系。 (二)調查階段 分析人員應制定工作分析的時間計劃進度表,以保證這項工作能夠按部就班的進行調查。同時搜集有關職位的相關信息。這一階段包括以下幾項內容: 1、選擇信息來源。信息主要來源於:工作執行者本人、管理監督者、顧客、分析專家、職業名稱辭典以及以往的分析資料。 2、選擇收集信息的方法和系統。信息收集的方法和分析信息適用的系統由工作分析人員根據企業的實際需要靈活運用。 3、搜集職位的相關信息 (三)分析階段 工作分析就是審查、分析企業某個工作有關的信息的過程。也就是說,該階段包括信息的整理、審查、分析三個相關活動,是整個工作分析過程的主要部分。 1、工作名稱該名稱必須明確,使人看到工作名稱,就可以大致了解工作內容。如果該工作已完成了工作評價,在工資上已有固定的等級,則名稱上可加上等級。 2、聘用人員數目同一工作所聘用工作人員的數目和性別,應予以記錄。 3、工作單位工作單位是顯示工作所在的單位及其上下左右的關系,也就是說明工作的組織位置。 4、職責所謂職責,就是這項工作的許可權和責任有多大,主要包括以下幾方面: 5、工作知識工作知識是為圓滿完成某項工作,工作人員應具備的實際知識。這種知識應包括任用後為執行其工作任務所需獲得的知識,以及任用前已具備的知識。 6、智力要求智力要求指在執行過程中所需運用的智力,包括判斷、決策、警覺、主動、積極、反應、適應等。
4. 主成分分析和因子分析是什麼
主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標。因子分析是研究如何以最少的信息丟失,將眾多原始變數濃縮成少數幾個因子變數,以及如何使因子變數具有較強的可解釋性的一種多元統計分析方法。
主成分分析,是考察多個變數間相關性一種多元統計方法,研究如何通過少數幾個主成分來揭示多個變數間的內部結構,即從原始變數中導出少數幾個主成分,使它們盡可能多地保留原始變數的信息,且彼此間互不相關.通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。
主成分分析和因子分析的不同:
1、原理不同:
主成分分析是利用降維(線性變換)的思想,在損失很少信息的前提下把多個指標轉化為幾個不相關的綜合指標(主成分),即每個主成分都是原始變數的線性組合,使得主成分比原始變數具有某些更優越的性能,從而達到簡化系統結構,抓住問題實質的目的。
而因子分析更傾向於從數據出發,描述原始變數的相關關系,是由研究原始變數相關矩陣內部的依賴關系出發,把錯綜復雜關系的變數表示成少數的公共因子和僅對某一個變數有作用的特殊因子線性組合而成。
2、線性表示方向不同:
主成分分析中是把主成分表示成各變數的線性組合,而因子分析是把變數表示成各公因子的線性組合。
3、假設條件不同:
主成分分析不需要有假設條件;而因子分析需要一些假設。因子分析的假設包括:各個共同因子之間不相關,特殊因子之間也不相關,共同因子和特殊因子之間也不相關。
5. 主成份分析和因子分析分別是什麼
主成分分析和因子分析都是信息濃縮的方法,即將多個分析項信息濃縮成幾個概括性指標。
因子分析在主成分基礎上,多出一項旋轉功能,該旋轉目的即在於命名,更容易解釋因子的含義。如果研究關注於指標與分析項的對應關繫上,或是希望將得到的指標進行命名,SPSSAU建議使用因子分析。
主成分分析目的在於信息濃縮(但不太關注主成分與分析項對應關系),權重計算,以及綜合得分計算。如希望進行排名比較,計算綜合競爭力,可使用主成分分析。
SPSSAU可直接使用這兩種方法,支持自動保存因子得分及綜合得分,不需要手動計算。
(5)因子分析的三種方法主因子分析法擴展閱讀:
用F1的分量作為系數,用標准化變數Z1,…Zk作為新變數建立線性組合F1,稱為第1主成份。用F2的分量作為系數,用標准比變數Z1,…Zk作為新變數,建立線性組合後,稱為第2主成份。由此可見,主成份F1、F2都是綜合性指標。
將數據標准化的數值代入建立的線性組合F1、F2中,就可得出第1主成份和第2主成份的得分,並以此得分高低來排出名次,從而對所研究的問題作出分析評價。
6. 主成分分析法與因子分析法的區別
一、性質不同
1、主成分分析法性質:通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數。
2、因子分析法性質:研究從變數群中提取共性因子的統計技術。
二、應用不同
1、主成分分析法應用:比如人口統計學、數量地理學、分子動力學模擬、數學建模、數理分析等學科中均有應用,是一種常用的多變數分析方法。
2、因子分析法應用:
(1)消費者習慣和態度研究(U&A)
(2) 品牌形象和特性研究
(3)服務質量調查
(4) 個性測試
(5)形象調查
(6) 市場劃分識別
(7)顧客、產品和行為分類
(6)因子分析的三種方法主因子分析法擴展閱讀:
主成分分析的原理是設法將原來變數重新組合成一組新的相互無關的幾個綜合變數,同時,根據實際需要,盡量少取幾個求和變數,以反映原始變數的信息。
這種統計方法被稱為主成分分析或主成分分析,這也是一種處理降維的數學方法。主成分分析(PCA)是試圖用一組新的不相關的綜合指標來代替原來的指標。
因子分析為社會研究的一種有力工具,但不能確定一項研究中有幾個因子。當研究中選擇的變數發生變化時,因素的數量也會發生變化。此外,對每個因素的實際含義的解釋也不是絕對的。
7. 試述主成分分析,因子分析和對應分析三者之間的區別與聯系
一、方式不同:
1、主成分分析:
通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數叫主成分。
2、因子分析:
通過從變數群中提取共性因子,因子分析可在許多變數中找出隱藏的具有代表性的因子。
3、對應分析:
通過分析由定性變數構成的交互匯總表來揭示變數。
二、作用體現不同:
1、主成分分析:
主成分分析作為基礎的數學分析方法,其實際應用十分廣泛,比如人口統計學、數量地理學、分子動力學模擬、數學建模、數理分析等學科中均有應用。
2、因子分析:
因子分析在市場調研中有著廣泛的應用,主要包括消費者習慣和態度研究、品牌形象和特性研究、服務質量調查、個性測試。
3、對應分析:
能把眾多的樣品和眾多的變數同時作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省去了因子選擇和因子軸旋轉等復雜的數學運算及中間過程,可以從因子載荷圖上對樣品進行直觀的分類,是一種直觀、簡單、方便的多元統計方法。
(7)因子分析的三種方法主因子分析法擴展閱讀
主成分分析對於原先提出的所有變數,將重復的變數(關系緊密的變數)刪去多餘,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息。
對應分析是由法國人Benzenci於1970年提出的,起初在法國和日本最為流行,然後引入到美國。對應分析法是在R型和Q型因子分析的基礎上發展起來的一種多元統計分析方法,因此對應分析又稱為R-Q型因子分析。
在因子分析中,如果研究的對象是樣品,則需採用Q型因子分析;如果研究的對象是變數,則需採用R型因子分析。但是,這兩種分析方法往往是相互對立的,必須分別對樣品和變數進行處理。
8. 因子分析法的分析步驟
因子分析的核心問題有兩個:一是如何構造因子變數;二是如何對因子變數進行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個核心問題展開的。
(i)因子分析常常有以下四個基本步驟:
⑴確認待分析的原變數是否適合作因子分析。
⑵構造因子變數。
⑶利用旋轉方法使因子變數更具有可解釋性。
⑷計算因子變數得分。
(ii)因子分析的計算過程:
⑴將原始數據標准化,以消除變數間在數量級和量綱上的不同。
⑵求標准化數據的相關矩陣;
⑶求相關矩陣的特徵值和特徵向量;
⑷計算方差貢獻率與累積方差貢獻率;
⑸確定因子:
設F1,F2,…, Fp為p個因子,其中前m個因子包含的數據信息總量(即其累積貢獻率)不低於80%時,可取前m個因子來反映原評價指標;
⑹因子旋轉:
若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉以獲得較為明顯的實際含義。
⑺用原指標的線性組合來求各因子得分:
採用回歸估計法,Bartlett估計法或Thomson估計法計算因子得分。
⑻綜合得分
以各因子的方差貢獻率為權,由各因子的線性組合得到綜合評價指標函數。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此處wi為旋轉前或旋轉後因子的方差貢獻率。
⑼得分排序:利用綜合得分可以得到得分名次。
在採用多元統計分析技術進行數據處理、建立宏觀或微觀系統模型時,需要研究以下幾個方面的問題:
· 簡化系統結構,探討系統內核。可採用主成分分析、因子分析、對應分析等方法,在眾多因素中找出各個變數最佳的子集合,從子集合所包含的信息描述多變數的系統結果及各個因子對系統的影響。「從樹木看森林」,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡化系統的結構,認識系統的內核。
· 構造預測模型,進行預報控制。在自然和社會科學領域的科研與生產中,探索多變數系統運動的客觀規律及其與外部環境的關系,進行預測預報,以實現對系統的最優控制,是應用多元統計分析技術的主要目的。在多元分析中,用於預報控制的模型有兩大類。一類是預測預報模型,通常採用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術。另一類是描述性模型,通常採用聚類分析的建模技術。
· 進行數值分類,構造分類模式。在多變數系統的分析中,往往需要將系統性質相似的事物或現象歸為一類。以便找出它們之間的聯系和內在規律性。過去許多研究多是按單因素進行定性處理,以致處理結果反映不出系統的總的特徵。進行數值分類,構造分類模式一般採用聚類分析和判別分析技術。
如何選擇適當的方法來解決實際問題,需要對問題進行綜合考慮。對一個問題可以綜合運用多種統計方法進行分析。例如一個預報模型的建立,可先根據有關生物學、生態學原理,確定理論模型和試驗設計;根據試驗結果,收集試驗資料;對資料進行初步提煉;然後應用統計分析方法(如相關分析、逐步回歸分析、主成分分析等)研究各個變數之間的相關性,選擇最佳的變數子集合;在此基礎上構造預報模型,最後對模型進行診斷和優化處理,並應用於生產實際。
9. 因子分析的簡介
因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發抽因法、拉奧典型抽因法等等。這些方法本質上大都屬近似方法,是以相關系數矩陣為基礎的,所不同的是相關系數矩陣對角線上的值,採用不同的共同性□2估值。在社會學研究中,因子分析常採用以主成分分析為基礎的反覆法。
主成分分析為基礎的反覆法主成分分析的目的與因子分析不同,它不是抽取變數群中的共性因子,而是將變數□1,□2,…,□□進行線性組合,成為互為正交的新變數□1,□2,…,□□,以確保新變數具有最大的方差:
在求解中,正如因子分析一樣,要用到相關系數矩陣或協方差矩陣。其特徵值□1,□2,…,□□,正是□1,□2,…,□□的方差,對應的標准化特徵向量,正是方程中的系數□,□,…,□。如果□1>□2,…,□□,則對應的□1,□2,…,□□分別稱作第一主成分,第二主成分,……,直至第□主成分。如果信息無需保留100%,則可依次保留一部分主成分□1,□2,…,□□(□<□)。
當根據主成分分析,決定保留□個主成分之後,接著求□個特徵向量的行平方和,作為共同性□:
□並將此值代替相關數矩陣對角線之值,形成約相關矩陣。根據約相關系數矩陣,可進一步通過反復求特徵值和特徵向量方法確定因子數目和因子的系數。
因子旋轉為了確定因子的實際內容,還須進一步旋轉因子,使每一個變數盡量只負荷於一個因子之上。這就是簡單的結構准則。常用的旋轉有直角旋轉法和斜角旋轉法。作直角旋轉時,各因素仍保持相對獨立。在作斜角旋轉時,允許因素間存在一定關系。
Q型因子分析 上述從變數群中提取共性因子的方法,又稱R型因子分析和R型主要成分分析。但如果研究個案群的共性因子,則稱Q型因子分析和Q型主成分分析。這時只須把調查的□個方案,當作□個變數,其分析方法與R型因子分析完全相同。
因子分析是社會研究的一種有力工具,但不能肯定地說一項研究中含有幾個因子,當研究中選擇的變數變化時,因子的數量也要變化。此外對每個因子實際含意的解釋也不是絕對的。
10. 因子分析法(FA)
3.2.1.1 技術原理
因子分析是研究相關陣或協方差陣的內部依賴關系,它將多個變數綜合為少數幾個因子,以再現原始變數與因子之間的相關關系。R型因子分析研究變數(指標)之間的相關關系,通過對變數的相關陣或協方差陣內部結構的研究,找出控制所有變數的幾個公共因子(或稱主因子、潛因子),用以對變數或樣品進行分類;Q型因子分析研究樣品之間的相關關系,通過對樣品的相似矩陣內部結構的研究找出控制所有樣品的幾個主要因素(或稱主因子)這兩種因子分析的處理方法一樣,只是出發點不同。R型從變數的相關陣出發,Q型從樣品的相似矩陣出發。對一批觀測數據,可以根據實際問題的需要來決定採用哪一種類型的因子分析。
對多變數的平面數據進行最佳綜合和簡化,即在保證數據信息丟失最少的原則下,對高維變數空間進行降維處理。可以通過下面的數學模型來表示:
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
式中:x1,x2,…,xi是p個原有變數,是均值為零、標准差為1的標准化變數,經過降維處理,p個變數可以綜合成m個新指標 F1,F2,…,Fm,且 x 可由 Fm線性表示出,即:x=AF+ε,其中矩陣A=(αij)p×m,為因子載荷矩陣,aij統計學中稱為「權重」。
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
式中:A是第i個原有變數在第j個因子變數上的負荷,公共因子矩陣F=(F1,F2,…,Fm),特殊因子矩陣ε=(ε1,ε2,…,εi)T,表示了原有變數不能被因子變數所解釋的部分,相當於多元回歸分析中的殘差部分。
因子載荷矩陣A中各行元素的平方和,稱為變數共同度,是全部公共因子對變數Xi的總方差所作出的貢獻,稱為公因子方差,表明xi對公共因子F1,F2,…,Fm的共同依賴程度。
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
因子載荷矩陣A中各列元素的平方和,記為
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
式中:
3.2.1.2 技術流程
(1)數據合理性檢驗
因子分析的應用要求原始變數之間有較強的相關關系,因此,在分析之前,首先需要對數據進行相關性分析,最簡單的方法就是計算變數之間的相關系數矩陣。如果相關系數矩陣在進行統計檢驗中,大部分都小於0.3,那麼這些變數就不適合進行因子分析。SPSS常用的統計檢驗方法有巴特利特球形檢驗、反映像相關矩陣檢驗和KMO檢驗。
巴特利特球形檢驗(Bartlett Test of Sphericity),若檢驗統計量較大,則認為原始數據間存在相關性,適合進行因子分析,否則不適合。
反映像相關矩陣檢驗(Anti-image Correlation Matrix),反映像相關矩陣中元素的絕對值比較大,那麼說明這些變數不適合做因子分析。
KMO(Kaiser Meyer Olkin)檢驗如表3.1。
表3.1 KMO檢驗標准表
(2)構造因子變數
構造因子變數的方法有很多種,如基於主成分模型的主成分分析法和基於因子分析模型的主軸因子法、極大似然法、最小二乘法等。
(3)利用旋轉使得因子變數更具有可解釋性
載荷矩陣A中某一行可能有多個aij比較大,說明某個原有變數可能同時與幾個因子有比較大的相關關系;同時載荷矩陣A中某一列中也可能有多個aij較大,說明某個因子變數可能解釋多個原變數的信息,但它只能解釋某個變數一小部分信息,不是任何一個變數的典型代表,會使某個因子變數的含義模糊不清。在實際分析中,希望對因子變數的含義有比較清楚的認識,這時,可以通過因子矩陣的旋轉來進行。旋轉的方式有正交旋轉、斜交旋轉、方差極大法,其中最常用的是方差極大法。
(4)計算因子變數的得分
計算因子得分首先將因子變數表示為原有變數的線性組合,即:
Fm=βm1x1+βm2x2+…+βmixi (3.5)
估計因子得分的方法有回歸法、Bar-tlette法、Anderson-Rubin 法等。默認取特徵值大於1的公因子或累計貢獻率大於85%(70%或90%)的最小正整數的因子(圖3.2)。
圖3.2 技術流程圖
3.2.1.3 適用范圍
因子分析是研究相關陣或協方差陣的內部依賴關系,它將多個變數綜合為少數幾個因子,以再現原始變數與因子之間的相關關系。FA法使用簡單,不需要研究地區優先源的監測數據,在缺乏污染源成分譜的情況下仍可解析,並可廣泛使用統計軟體處理數據。其不足之處在於需要輸入大量數據,而且只能得到各類元素對主因子的相對貢獻百分比。