1. 如何進行主成分分析
主成分分析法的基本思想
主成分分析(Principal Component Analysis)是利用降維的思想,將多個變數轉化為少數幾個綜合變數(即主成分),其中每個主成分都是原始變數的線性組合,各主成分之間互不相關,從而這些主成分能夠反映始變數的絕大部分信息,且所含的信息互不重疊.採用這種方法可以克服單一的財務指標不能真實反映公司的財務情況的缺點,引進多方面的財務指標,但又將復雜因素歸結為幾個主成分,使得復雜問題得以簡化,同時得到更為科學、准確的財務信息。
具體的實際操作我也在學習,主要是在實驗室分析,用minitab
網上有很多這方面的資料,你可以自己去詳細地看
希望對你有用
2. spss中的主成分分析怎麼操作
主成分分析,是現將原始數據標准化;建立變數之間的相關系數矩陣;求R的特徵值和特徵向量;寫出主成分並進行分析。
spss的操作:分析-回歸分析-線性。將變數選入因變數,將其他幾個考察因素選入自變數。
進行多重回歸分析及共線性診斷。之後金牛星主成分分析確定所需主成分
操作:分析-降維-因子分析,打開主成分分析,將變數選入列表框。
3. 主成分分析法(PCA)
3.2.2.1 技術原理
主成分分析方法(PCA)是常用的數據降維方法,應用於多變數大樣本的統計分析當中,大量的統計數據能夠提供豐富的信息,利於進行規律探索,但同時增加了其他非主要因素的干擾和問題分析的復雜性,增加了工作量,影響分析結果的精確程度,因此利用主成分分析的降維方法,對所收集的資料作全面的分析,減少分析指標的同時,盡量減少原指標包含信息的損失,把多個變數(指標)化為少數幾個可以反映原來多個變數的大部分信息的綜合指標。
主成分分析法的建立,假設xi1,xi2,…,xim是i個樣品的m個原有變數,是均值為零、標准差為1的標准化變數,概化為p個綜合指標F1,F2,…,Fp,則主成分可由原始變數線性表示:
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
計算主成分模型中的各個成分載荷。通過對主成分和成分載荷的數據處理產生主成分分析結論。
3.2.2.2 方法流程
1)首先對數據進行標准化,消除不同量綱對數據的影響,標准化可採用極值法
圖3.3 方法流程圖
2)根據標准化數據求出方差矩陣;
3)求出共變數矩陣的特徵根和特徵變數,根據特徵根,確定主成分;
4)結合專業知識和各主成分所蘊藏的信息給予恰當的解釋,並充分運用其來判斷樣品的特性。
3.2.2.3 適用范圍
主成分分析不能作為一個模型來描述,它只是通常的變數變換,主成分分析中主成分的個數和變數個數p相同,是將主成分表示為原始變數的線性組合,它是將一組具有相關關系的變數變換為一組互不相關的變數。適用於對具有相關性的多指標進行降維,尋求主要影響因素的統計問題。
4. 主成分分析的主要步驟包括
主成分分析是指通過將一組可能存在相關性的變數轉換城一組線性不相關的變數,轉換後的這組變數叫主成分。
主成分分析步驟:1、對原始數據標准化,2、計算相關系數,3、計算特徵,4、確定主成分,5、合成主成分。
主成分分析的原理是設法將原來變數重新組合成一組新的相互無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的總和變數盡可能多地反映原來變數的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上處理降維的一種方法。
主成分分析的主要作用
1.主成分分析能降低所研究的數據空間的維數。
2.有時可通過因子負荷aij的結論,弄清X變數間的某些關系。
3.多維數據的一種圖形表示方法。
4.由主成分分析法構造回歸模型。即把各主成分作為新自變數代替原來自變數x做回歸分析。
5.用主成分分析篩選回歸變數。
最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Va(rF1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。
5. 因子分析法如何確定主成分及各個指標的權重
(1)首先將數據標准化,這是考慮到不同數據間的量綱不一致,因而必須要無量綱化。
(2)對標准化後的數據進行因子分析(主成分方法),使用方差最大化旋轉。
(3)寫出主因子得分和每個主因子的方程貢獻率。 Fj =β1j*X1 +β2j*X2 +β3j*X3 + ……+ βnj*Xn ; Fj 為主成分(j=1、2、……、m),X1、X2 、X3 、……、Xn 為各個指標,β1j、β2j、β3j、……、βnj為各指標在主成分Fj 中的系數得分,用ej表示Fj的方程貢獻率。
(4)求出指標權重。 ωi=[(m∑j)βij*ej]/[(n∑i)(m∑j)βij*ej],ωi就是指標Xi的權重。
(5)主成分分析中因素的選取方法擴展閱讀
產品特點
1、操作簡便
界面非常友好,除了數據錄入及部分命令程序等少數輸入工作需要鍵盤鍵入外,大多數操作可通過滑鼠拖曳、點擊「菜單」、「按鈕」和「對話框」來完成。
2、編程方便
具有第四代語言的特點,告訴系統要做什麼,無需告訴怎樣做。只要了解統計分析的原理,無需通曉統計方法的各種演算法,即可得到需要的統計分析結果。
對於常見的統計方法,SPSS的命令語句、子命令及選擇項的選擇絕大部分由「對話框」的操作完成。因此,用戶無需花大量時間記憶大量的命令、過程、選擇項。
3、功能強大
具有完整的數據輸入、編輯、統計分析、報表、圖形製作等功能。自帶11種類型136個函數。SPSS提供了從簡單的統計描述到復雜的多因素統計分析方法,比如數據的探索性分析、統計描述、列聯表分析、二維相關、秩相關、偏相關、方差分析、非參數檢驗、多元回歸、生存分析、協方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。
6. SPSS軟體主成分分析中可以通過累計貢獻率85%這種方法來選取主成分嗎,即軟體分析出來的結果已經大於85%謝
因素分析的主要目的還是簡化題目的結構,把多數單個的題目進行歸類,歸為少數幾個因子,所以在spss裡面因素分析在降維菜單下。因此,因素分析最主要的還是要用最少的維度來貢獻最多的變異,這應該才是最主要的標准。即便貢獻率超過85%,也要看:第一,是否產生了過多的維度,維度過多因素分析就意義不大了;第二,是否有些維度的貢獻率偏低,貢獻率偏低的話不要也罷。
事實上對於做研究,40%的累積貢獻率已經算是可以接受,50%以上就可以作為實際應用的標准了。倒是85%顯得過於嚴苛。當然如果能達到這個水平且維度少,每個維度的貢獻率又都比較高,那就很理想。
spss做因素分析選取主成分個數的標准一般就是兩個:第一是特徵值,大於1的提取出來,這只是個大概;第二是參考碎石圖,看看碎石圖拐點出現的位置,看看圖從什麼地方開始趨於平緩。綜合這兩點,然後再看看累積貢獻率是否合適,就可以完成成份的選取。
7. spss中主成分分析
主成分分析用於對數據信息進行濃縮,比如總共有20個指標值,是否可以將此20項濃縮成4個概括性指標。
第一步:判斷是否進行主成分(pca)分析;判斷標准為KMO值大於0.6.
第二步:主成分與分析項對應關系判斷.
第三步:在第二步刪除掉不合理分析項後,並且確認主成分與分析項對應關系良好後,則可結合主成分與分析項對應關系,對主成分進行命名.
spssau主成分分析操作共有三步:
①選擇【進階方法】--【主成分分析】
②將分析項拖拽到右側分析框
③點擊開始分析
默認提供主成分得分和綜合得分,分析前勾選「成分得分」、「綜合得分」即可。
8. 主成分分析法
在對災毀土地復墾效益進行分析時,會碰到眾多因素,各因素間又相互關聯,將這些存在相關關系的因素通過數學方法綜合成少數幾個最終參評因素,使這幾個新的因素既包含原來因素的信息又相互獨立。簡化問題並抓住其本質是分析過程中的關鍵,主成分分析法可以解決這個難題。
(一)主成分分析的基本原理
主成分分析法(Principal Components Analysis,PCA)是把原來多個變數化為少數幾個綜合指標的一種統計分析方法。從數學角度來看,這是一種降維處理方法,即通過對原始指標相關矩陣內部結果關系的研究,將原來指標重新組合成一組新的相互獨立的指標,並從中選取幾個綜合指標來反映原始指標的信息。假定有n個評價單元,每個評價單元用m個因素來描述,這樣就構成一個n×m階數據矩陣:
災害損毀土地復墾
如果記m個因素為 x1,x2,…,xm,它們的綜合因素為 z1,z2,…,zp(p≤m),則:
災害損毀土地復墾
系數lij由下列原則來決定:
(1)zi與zj(i≠j,i,j=1,2,…,p)相互無關;
(2)z1是x1,x2,…,xm的一切線性組合中方差最大者,依此類推。
依據該原則確定的綜合變數指標z1,z2,…,zp分別稱為原始指標的第1、第2、…、第p個主成分,分析時可只挑選前幾個方差最大的主成分。
(二)主成分分析法的步驟
(1)將原始數據進行標准化處理,以消除原始數據在數量級或量綱上的差異。
(2)計算標准化的相關數據矩陣:
災害損毀土地復墾
(3)用雅克比法求相關系數矩陣R的特徵值(λ1,λ2,…,λp)和與之相對應的特徵向量 αi=(αi1,αi2,…,αip),i=1,2,…,p。
(4)選擇重要的主成分,並寫出其表達式。
主成分分析可以得到P個主成分,但是由於各個主成分的方差與其包含的信息量皆是遞減的,所以在實際分析時,一般不選取P個主成分,而是根據各個主成分所累計的貢獻率的大小來選取前K個主成分,這里的貢獻率是指某個主成分的方差在全部方差中所佔的比重,實際上也是某個特徵值在全部特徵值合計中所佔的比重。即:
災害損毀土地復墾
這說明,主成分所包含的原始變數的信息越強,貢獻率也就越大。主成分的累計貢獻率決定了主成分個數K的選取情況,為了保證綜合變數能包括原始變數的絕大多數信息,一般要求累計貢獻率達到85%以上。
另外,在實際應用過程中,選擇主成分之後,還要注意主成分實際含義的解釋。如何給主成分賦予新的含義,給出合理的解釋是主成分分析中一個相當關鍵的問題。一般來說,這個解釋需要根據主成分表達式的系數而定,並與定性分析來進行有效結合。主成分是原來變數的線性組合,在這個線性組合中各變數的系數有正有負、有大有小,有的又大小相當,因此不能簡單地把這個主成分看作是某個原變數的屬性作用。線性組合中各變數系數的絕對值越大表明該主成分主要包含了該變數;如果有幾個大小相當的變數系數時,則認為這一主成分是這幾個變數的綜合,而這幾個變數綜合在一起具有什麼樣的實際意義,就需要結合具體的問題和專業,給出合理的解釋,進而才能達到准確分析的目的。
(5)計算主成分得分。根據標准化的原始數據,將各個樣品分別代入主成分表達式,就可以得到各主成分下的各個樣品的新數據,即為主成分得分。具體形式可如下:
災害損毀土地復墾
(6)依據主成分得分的數據,則可以進行進一步的統計分析。其中,常見的應用有主成分回歸,變數子集合的選擇,綜合評價等。
(三)主成分分析法的評價
通過主成分分析法來評價復墾產生的效益,可將多個指標轉化成盡可能少的綜合性指標,使綜合指標間互不相干,既減少了原指標信息的重疊度,又不丟失原指標信息的總含量。該方法不僅將多個指標轉化成綜合性指標,而且也能對每個主成分的影響因素進行分析,從而判別出影響整個評價體系的關鍵因素,並且主成分分析法在確定權重時可以科學地賦值,以避免主觀因素的影響。
需要注意的是,主成分分析法雖然可以對每個主成分的權重進行科學、定量的計算,避免人為因素及主觀因素的影響,但是有時候賦權的結果可能與客觀實際有一定誤差。因此,利用主成分分析法確定權重後,再結合不同專家給的權重,是最好的解決辦法。這樣可以在定量的基礎上作出定性的分析,通過一定的數理方法將兩種數據結合起來考慮。
9. 對地價影響因素進行主成分分析時一般選取什麼經濟指標
主成分分析法的缺點:1、在主成分分析中,我們首先應保證所提取的前幾個主成分的累計貢獻率達到一個較高的水平(即變數降維後的信息量須保持在一個較高水平上),其次對這些被提取的主成分必須都能夠給出符合實際背景和意義的解釋(否則主成分將空有信息量而無實際含義)。2、主成分的解釋其含義一般多少帶有點模糊性,不像原始變數的含義那麼清楚、確切,這是變數降維過程中不得不付出的代價。因此,提取的主成分個數m通常應明顯小於原始變數個數p(除非p本身較小),否則維數降低的「利」可能抵不過主成分含義不如原始變數清楚的「弊」。
10. 因子分析中如果利用主成分方法獲取因子載荷,選擇因子數目方法有哪些
因子提取和因子載荷矩陣的求解:基於主成分模型的主成分分析法、基於因子分析模型的主軸因子法、極大似然法、最小二乘法、a因子提取法、映像分析法。主成分分析法能夠為因子分析提供初始解,因子分析是主成分分析結果的延伸和拓展。
很高興能回答您的提問,您不用添加任何財富,只要及時採納就是對我們最好的回報
。若提問人還有任何不懂的地方可隨時追問,我會盡量解答,祝您學業進步,謝謝。
☆⌒_⌒☆ 如果問題解決後,請點擊下面的「選為滿意答案」