⑴ 常用的多元分析方法
多元分析方法包括3類:
多元方差分析、多元回歸分析和協方差分析,稱為線性模型方法,用以研究確定的自變數與因變數之間的關系;判別函數分析和聚類分析,用以研究對事物的分類;主成分分析、典型相關和因素分析,研究如何用較少的綜合因素代替為數較多的原始變數。
多元方差是把總變異按照其來源分為多個部分,從而檢驗各個因素對因變數的影響以及各因素間交互作用的統計方法。
判別函數是判定個體所屬類別的統計方法。其基本原理是:根據兩個或多個已知類別的樣本觀測資料確定一個或幾個線性判別函數和判別指標,然後用該判別函數依據判別指標來判定另一個個體屬於哪一類。
(1)多元統計分析設計方法擴展閱讀
多元分析方法的歷史:
首先涉足多元分析方法是F.高爾頓,他於1889年把雙變數的正態分布方法運用於傳統的統計學,創立了相關系數和線性回歸。
其後的幾十年中,斯皮爾曼提出因素分析法,費希爾提出方差分析和判別分析,威爾克斯發展了多元方差分析,霍特林確定了主成分分析和典型相關。到20世紀前半葉,多元分析理論大多已經確立。
60年代以後,隨著計算機科學的發展,多元分析方法在心理學以及其他許多學科的研究中得到了越來越廣泛的應用。
⑵ SPSS統計分析高級教程的目錄
第一部分一般線性與混合線性模型.
第1章方差分析模型
1.1模型簡介
1.1.1模型入門
1.1.2常用術語
1.1.3方差分析模型的適用條件
1.2簡單分析實例
1.2.1模型表達式
1.2.2初步分析結果
1.2.3模型參數的估計值
1.2.4兩兩比較
1.2.5其他常用選項
1.3兩因素方差分析模型
1.3.1分析實例
1.3.2邊際均數與輪廓圖
1.3.3擬和劣度檢驗
1.4因素各水平間的精細比較
1.4.1POSTHOC子句
1.4.2EMMEANS子句
1.4.3LMATRIX和KMATRIX子句
1.4.4CONSTRAST子句
1.5隨機因素的方差分析模型
1.6其他問題
1.6.1自定義效應檢驗使用的誤差項
1.6.2四類方差分解方法
第2章常用實驗設計分析方法
2.1僅研究主效應的實驗設計方案
2.1.1完全隨機設計(CompletelyRandomDesign)
2.1.2配伍組設計(RandomizedBlockDesign)
2.1.3交叉設計(Cross-overDesign)
2.1.4拉丁方設計(LatinSquareDesign)
2.2考慮交互作用的實驗設計方案
2.2.1析因設計(FactorialDesign)
2.2.2正交設計(OrthogonalDesign)
2.2.3均勻設計(UniformDesign)
2.3誤差項變動的特殊實驗設計方案
2.3.1嵌套設計(NestedDesign)
2.3.2重復測量設計(RepeatedMeasureDesign)
2.3.3裂區設計(Split-plotDesign)
2.4協方差分析(AnalysisofCovariance)
2.4.1協方差分析的必要性
2.4.2平行性假定的檢驗
2.4.3計算和檢驗修正均數
第3章多元方差分析與重復測量方差分析
3.1多元方差分析
3.1.1模型簡介
3.2.2分析實例
3.3.3檢驗統計量的計算
3.3.4對引例的進一步分析
3.2重復測量資料的方差分析
3.2.1模型簡介
3.2.2分析實例
第4章混合線性模型入門
4.1模型簡介
4.1.1問題的提出
4.1.2模型入門
4.2層次聚集性數據分析實例
4.1.1擬合混合線性模型的基本結構
4.1.2在固定效應中加入自變數
4.1.3在隨機效應中加入自變數
4.1.4更多解釋變數的引入
4.1.5其他常用選項
4.3重復測量數據分析實例
4.3.1對數據的初步分析
4.3.2擬合混合線性模型的基本結構
4.3.3考慮重復測量間的相關性
4.3.4更改對測量間相關性的假定
4.3.5模型中可用的相關陣種類
4.4本章方法小結
4.4.1混合效應模型的用途
4.4.2混合效應模型與一般線性模型的聯系
第二部分回歸模型
第5章多重線性回歸模型
5.1模型簡介
5.2簡單分析實例
5.2.1對數據的初步分析
5.2.2回歸模型的假設檢驗
5.2.3偏回歸系數的假設檢驗
5.2.4標准化偏回歸系數
5.2.5衡量多元線性回歸模型優劣的標准
5.3回歸預測與殘差分析
5.3.1回歸預測與區間估計
5.3.2殘差分析與模型適用條件的檢驗
5.4逐步回歸
5.4.1篩選自變數的基本原則
5.4.2常用的逐步回歸方法
5.4.3分析實例
5.5模型的進一步診斷與修正
5.5.1強影響點的識別與處理
5.5.2多重共線性的識別與處理
5.6本章方法小結
5.6.1回歸模型的建立步驟
5.6.2多重線性回歸模型結果解釋時應注意的問題
第6章線性回歸的衍生模型
6.1非直線趨勢的處理:曲線直線化
6.1.1方法簡介
6.1.2使用Linear過程進行分析
6.1.3使用曲線擬合過程分析
6.2方差不齊的處理:加權最小二乘法
6.2.1方法簡介
6.2.2使用Linear過程進行分析
6.2.3使用WLS過程分析
6.3共線性的處理:嶺回歸
6.3.1方法簡介
6.3.2分析實例
6.4分類變數的數值化:最優尺度回歸
6.4.1方法簡介
6.4.2分析實例
6.4.3最優尺度方法的應用注意事項
第7章路徑分析入門
7.1兩階段最小二乘法
7.1.1模型簡介
7.1.2使用Linear過程進行分析
7.1.3使用2SLS過程進行分析
7.2路徑分析入門
7.2.1模型簡介
7.2.2分析實例
第8章非線性回歸模型
8.1模型簡介
8.1.1問題的提出
8.1.2模型入門
8.2簡單分析實例
8.2.1軟體操作與界面說明
8.2.2基本分析結果
8.2.3模型的進一步分析
8.3自定義損失函數:最小一乘法實例
8.3.1分析實例
8.3.3結果解釋
8.4分段回歸模型的擬合
8.4.1分析實例
8.4.2結果解釋
8.4.3模型的進一步分析
8.5其他需要注意的問題
8.5.1參數初始值的設定
8.5.2模型的擬合方法
第9章二分類logistic回歸模型
9.1模型簡介
9.1.1模型入門
9.1.2一些基本概念
9.2簡單分析實例
9.3分類自變數的定義與比較方法
9.3.1使用啞變數的必要性
9.3.2SPSS中預設的啞變數編碼方式
9.3.3設置啞變數時要注意的問題
9.4自變數的篩選方法與逐步回歸
9.4.1模型中的假設檢驗方法
9.4.2自變數的篩選方法
9.4.3分析實例
9.5模型擬合效果與擬合優度檢驗
9.5.1模型效果的判斷指標
9.5.2擬合優度檢驗
9.6模型的診斷與修正
9.6.1殘差分析
9.6.2多重共線性的識別及其對回歸系數的影響及處理辦法
第10章多分類.配對logistic回歸與probit回歸
10.1有序多分類logistic回歸模型
10.1.1模型簡介
10.1.2分析實例
10.1.3模型適用條件的檢驗
10.2無序多分類logistic回歸模型
10.2.1模型簡介
10.2.2分析實例
10.31:1配對logistic回歸
10.3.1模型簡介
10.3.2分析實例
10.4probit回歸模型
10.4.1模型簡介
10.4.2實例一:與logistic模型比較
10.4.3實例二:計算LD50
第三部分多元統計分析方法
第11章主成分分析與因子分析
11.1主成分分析
11.1.1模型入門..
11.1.2簡單分析實例
11.1.3對主成分分析的進一步說明
11.2因子分析
11.2.1模型入門
11.2.4簡單分析實例
11.3因子分析的進一步討論
11.3.1不同的因子分析法
11.3.2相關陣和協方差
11.3.3確定公因子數量
11.4因子分析綜合案例
11.5主成分分析和因子分析的比較
第12章聚類分析
12.1模型簡介
12.1.1問題的提出
12.1.2聚類分析入門
12.1.3聚類分析的方法體系
12.2層次聚類法
12.2.1方法原理
12.2.2分析實例
12.2.3對層次聚類法的進一步討論
12.3K-均值聚類法
12.3.1方法原理
12.3.2分析實例
12.4兩步聚類法簡介
12.4.1方法原理
12.4.2分析實例
12.5本章方法小結
第13章判別分析
13.1模型簡介
13.1.1典型判別分析的基本原理
13.1.2判別分析的適用條件和違背條件時的處理方法
13.1.3判別效果的評價
13.1.4判別分析的一般步驟
13.2簡單分析實例
13.2.1軟體操作與界面說明
13.2.2基本分析結果
13.2.3判別結果的圖形化展示
13.2.4判別效果的驗證
13.2.5適用條件的判斷方法
13.3貝葉斯判別分析
13.3.1方法原理
13.3.2軟體實現
13.4對判別分析的進一步討論
13.4.1逐步判別分析
13.4.2判別分析和因子分析的相似性和差異
13.4.3二類判別和多重回歸的等價性
第14章典型相關分析
14.1方法介紹
14.1.1典型相關分析的基本思想
14.2.1典型相關分析的數學描述
14.2分析實例
14.2.1兩組變數間的相關系數
14.2.2典型相關系數及顯著性檢驗
11.2.3典型變數的系數
14.2.4典型結構分析
14.2.5典型冗餘分析
14.3本章方法小結
14.3.1典型相關分析的應用
14.3.2典型相關分析和因子分析
第15章對應分析
15.1模型簡介
15.1.1問題的提出
15.1.2模型入門
15.1.3SPSS中的相應功能
15.2簡單分析實例
15.2.1對數據的初步分析
15.2.2正式分析
15.2.3對引例的進一步分析
15.3基於均數的對應分析
15.3.1方法原理
15.3.2分析實例
15.4多重對應分析
15.4.1方法原理
15.4.2分析實例
15.5對應分析中的其它問題
15.5.1對應分析結果的正確解釋
15.5.2罕見類別和相似類別的處理
15.5.3有序類別的處理
15.6本章方法小結
15.6.1對應分析與其它分析方法的關系
15.6.2對應分析的優勢與劣勢
第16章多維尺度分析
16.1古典MDS模型
16.1.1方法原理
16.1.2分析實例
16.1.3距離的計算方式
16.2非度量MDS模型
16.2.1數據測量尺度的設定
16.2.2方法原理
16.2.3分析實例
16.3考慮個體差異的MDS模型
16.3.1方法原理
16.3.2分析實例
16.3.3空間定點陣圖的含義解釋
16.4基於最優尺度變換的MDS模型
16.4.1方法簡介
16.4.2分析實例
16.5本章方法小結
第四部分其他統計分析方法
第17章對數線性模型與Poisson回歸
17.1對數線性模型簡介
17.1.1問題的提出
17.1.2模型入門
17.1.3SPSS的相應功能
17.2一般對數線性模型分析實例
17.2.1對數據的初步分析
17.2.2正式分析
17.2.3對引例的進一步分析
17.3因果關系明確時的對數線性模型
17.4對數線性模型的選擇
17.4.1模型的選擇策略
17.4.2分析實例
17.5對數線性模型與其它模型的關系
17.5.1對數線性模型與方差分析模型的關系
17.5.2對數線性模型與Logistic回歸的關系
17.6Poisson回歸模型
17.6.1模型簡介
17.6.2分析實例
第18章信度分析
18.1信度理論入門
18.1.1真分數測量理論
18.1.2信度與效度
18.1.3內在信度與外在信度
18.1.4信度的判斷標准
18.2簡單分析實例
18.2.1Alpha信度系數
18.2.2對各題目的深入分析
18.2.3對真分數理論假設的考察
18.3其餘常用的信度系數
18.3.1重測信度
18.3.2折半信度
18.3.3Guttman系數
18.3.4平行模型的信度系數
18.3.5嚴格平行模型的信度系數
18.3.6評分者信度
18.3.7信度系數總結
18.4信度理論進階
18.4.1真分數測量理論的缺限
18.4.2概化理論入門
18.4.3SPSS中相應的分析功能
第19章生存分析
19.1生存分析簡介
19.1.1生存分析簡史
19.1.2生存分析中的基本概念
19.1.3生存分析的基本步驟
19.1.4SPSS與生存分析
19.2生存函數的估計和檢驗
19.2.1生存函數的基本估計方法
19.2.2Kaplan-Meier法
19.2.3壽命表法
19.2.4Kaplan-Meier法和壽命表法比較
19.3Cox回歸模型
19.3.1Cox模型入門
19.3.2分析實例
19.3.3比例風險性的圖形驗證
19.4含時間依存性變數的Cox模型
19.4.1時依協變數的種類
19.4.2用時依模型驗證比例風險性
19.4.3用時依模型評價處理因素的影響
19.4.4用時依模型評價重復測量因子的影響
19.5關於Cox模型的一些高級話題
19.5.1生存分析中的分層變數
19.5.2用Cox回歸過程擬合配伍Logistic回歸
19.5.3競爭風險的Cox模型
第20章缺失值分析入門
20.1缺失值理論簡介
20.1.1數據的缺失機制
20.1.2SPSS中對缺失值的處理方法
20.2對缺失情況的基本分析
20.2.1缺失值數據的生成
20.2.2對缺失模式的分析
20.2.3缺失情況的統計描述
20.3缺失值填充技術
20.3.1列表輸出
20.3.2使用回歸演算法進行填充
20.3.3使用EM演算法進行填充
20.3.4多重填充技術簡介
思考與練習
參考文獻
附錄...
⑶ 求高手指點,做多元統計分析課程設計用因子分析降維為什麼只剩一維,可以直接下結論還是哪裡出現了錯誤。
看你的條件設置
1 按方差貢獻程度
2 特徵值大小
3 自己指定因子數
⑷ 請問誰有關於統計的論文,具體要求是使用多元統計分析方法分析數據,還有如下:
1. 因子分析模型
因子分析法是從研究變數內部相關的依賴關系出發,把一些具有錯綜復雜關系的變數歸結為少數幾個綜合因子的一種多變數統計分析方法。它的基本思想是將觀測變數進行分類,將相關性較高,即聯系比較緊密的分在同一類中,而不同類變數之間的相關性則較低,那麼每一類變數實際上就代表了一個基本結構,即公共因子。對於所研究的問題就是試圖用最少個數的不可測的所謂公共因子的線性函數與特殊因子之和來描述原來觀測的每一分量。
因子分析的基本思想:
把每個研究變數分解為幾個影響因素變數,將每個原始變數分解成兩部分因素,一部分是由所有變數共同具有的少數幾個公共因子組成的,另一部分是每個變數獨自具有的因素,即特殊因子
因子分析模型描述如下:
(1)X = (x1,x2,…,xp)¢是可觀測隨機向量,均值向量E(X)=0,協方差陣Cov(X)=∑,且協方差陣∑與相關矩陣R相等(只要將變數標准化即可實現)。
(2)F = (F1,F2,…,Fm)¢ (m<p)是不可測的向量,其均值向量E(F)=0,協方差矩陣Cov(F) =I,即向量的各分量是相互獨立的。
(3)e = (e1,e2,…,ep)¢與F相互獨立,且E(e)=0, e的協方差陣∑是對角陣,即各分量e之間是相互獨立的,則模型:
x1 = a11F1+ a12F2 +…+a1mFm + e1
x2 = a21F1+a22F2 +…+a2mFm + e2
………
xp = ap1F1+ ap2F2 +…+apmFm + ep
稱為因子分析模型,由於該模型是針對變數進行的,各因子又是正交的,所以也稱為R型正交因子模型。
其矩陣形式為: x =AF + e .
其中:
x=,A=,F=,e=
這里,
(1)m £ p;
(2)Cov(F,e)=0,即F和e是不相關的;
(3)D(F) = Im ,即F1,F2,…,Fm不相關且方差均為1;
D(e)=,即e1,e2,…,ep不相關,且方差不同。
我們把F稱為X的公共因子或潛因子,矩陣A稱為因子載荷矩陣,e 稱為X的特殊因子。
A = (aij),aij為因子載荷。數學上可以證明,因子載荷aij就是第i變數與第j因子的相關系數,反映了第i變數在第j因子上的重要性。
2. 模型的統計意義
模型中F1,F2,…,Fm叫做主因子或公共因子,它們是在各個原觀測變數的表達式中都共同出現的因子,是相互獨立的不可觀測的理論變數。公共因子的含義,必須結合具體問題的實際意義而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨立的。模型中載荷矩陣A中的元素(aij)是為因子載荷。因子載荷aij是xi與Fj的協方差,也是xi與Fj的相關系數,它表示xi依賴Fj的程度。可將aij看作第i個變數在第j公共因子上的權,aij的絕對值越大(|aij|£1),表明xi與Fj的相依程度越大,或稱公共因子Fj對於xi的載荷量越大。為了得到因子分析結果的經濟解釋,因子載荷矩陣A中有兩個統計量十分重要,即變數共同度和公共因子的方差貢獻。
因子載荷矩陣A中第i行元素之平方和記為hi2,稱為變數xi的共同度。它是全部公共因子對xi的方差所做出的貢獻,反映了全部公共因子對變數xi的影響。hi2大表明x的第i個分量xi對於F的每一分量F1,F2,…,Fm的共同依賴程度大。
將因子載荷矩陣A的第j列( j =1,2,…,m)的各元素的平方和記為gj2,稱為公共因子Fj對x的方差貢獻。gj2就表示第j個公共因子Fj對於x的每一分量xi(i= 1,2,…,p)所提供方差的總和,它是衡量公共因子相對重要性的指標。gj2越大,表明公共因子Fj對x的貢獻越大,或者說對x的影響和作用就越大。如果將因子載荷矩陣A的所有gj2 ( j =1,2,…,m)都計算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。
3. 因子旋轉
建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析。如果求出主因子解後,各個主因子的典型代表變數不很突出,還需要進行因子旋轉,通過適當的旋轉得到比較滿意的主因子。
旋轉的方法有很多,正交旋轉(orthogonal rotation)和斜交旋轉(oblique rotation)是因子旋轉的兩類方法。最常用的方法是最大方差正交旋轉法(Varimax)。進行因子旋轉,就是要使因子載荷矩陣中因子載荷的平方值向0和1兩個方向分化,使大的載荷更大,小的載荷更小。因子旋轉過程中,如果因子對應軸相互正交,則稱為正交旋轉;如果因子對應軸相互間不是正交的,則稱為斜交旋轉。常用的斜交旋轉方法有Promax法等。
4.因子得分
因子分析模型建立後,還有一個重要的作用是應用因子分析模型去評價每個樣品在整個模型中的地位,即進行綜合評價。例如地區經濟發展的因子分析模型建立後,我們希望知道每個地區經濟發展的情況,把區域經濟劃分歸類,哪些地區發展較快,哪些中等發達,哪些較慢等。這時需要將公共因子用變數的線性組合來表示,也即由地區經濟的各項指標值來估計它的因子得分。
設公共因子F由變數x表示的線性組合為:
Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m
該式稱為因子得分函數,由它來計算每個樣品的公共因子得分。若取m=2,則將每個樣品的p個變數代入上式即可算出每個樣品的因子得分F1和F2,並將其在平面上做因子得分散點圖,進而對樣品進行分類或對原始數據進行更深入的研究。
但因子得分函數中方程的個數m小於變數的個數p,所以並不能精確計算出因子得分,只能對因子得分進行估計。估計因子得分的方法較多,常用的有回歸估計法,Bartlett估計法,Thomson估計法。
(1)回歸估計法
F = X b = X (X ¢X)-1A¢ = XR-1A¢ (這里R為相關陣,且R = X ¢X )。
(2)Bartlett估計法
Bartlett估計因子得分可由最小二乘法或極大似然法導出。
F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X
(3)Thomson估計法
在回歸估計法中,實際上是忽略特殊因子的作用,取R = X ¢X,若考慮特殊因子的作用,此時R = X ¢X+W,於是有:
F = XR-1A¢ = X (X ¢X+W)-1A¢
這就是Thomson估計的因子得分,使用矩陣求逆演算法(參考線性代數文獻)可以將其轉換為:
F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢
5. 因子分析的步驟
因子分析的核心問題有兩個:一是如何構造因子變數;二是如何對因子變數進行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個核心問題展開的。
(i)因子分析常常有以下四個基本步驟:
(1)確認待分析的原變數是否適合作因子分析。
(2)構造因子變數。
(3)利用旋轉方法使因子變數更具有可解釋性。
(4)計算因子變數得分。
(ii)因子分析的計算過程:
(1)將原始數據標准化,以消除變數間在數量級和量綱上的不同。
(2)求標准化數據的相關矩陣;
(3)求相關矩陣的特徵值和特徵向量;
(4)計算方差貢獻率與累積方差貢獻率;
(5)確定因子:
設F1,F2,…, Fp為p個因子,其中前m個因子包含的數據信息總量(即其累積貢獻率)不低於80%時,可取前m個因子來反映原評價指標;
(6)因子旋轉:
若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉以獲得較為明顯的實際含義。
(7)用原指標的線性組合來求各因子得分:
採用回歸估計法,Bartlett估計法或Thomson估計法計算因子得分。
(8)綜合得分
以各因子的方差貢獻率為權,由各因子的線性組合得到綜合評價指標函數。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此處wi為旋轉前或旋轉後因子的方差貢獻率。
(9)得分排序:利用綜合得分可以得到得分名次。
在採用多元統計分析技術進行數據處理、建立宏觀或微觀系統模型時,需要研究以下幾個方面的問題:
· 簡化系統結構,探討系統內核。可採用主成分分析、因子分析、對應分析等方法,在眾多因素中找出各個變數最佳的子集合,從子集合所包含的信息描述多變數的系統結果及各個因子對系統的影響。「從樹木看森林」,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡化系統的結構,認識系統的內核。
· 構造預測模型,進行預報控制。在自然和社會科學領域的科研與生產中,探索多變數系統運動的客觀規律及其與外部環境的關系,進行預測預報,以實現對系統的最優控制,是應用多元統計分析技術的主要目的。在多元分析中,用於預報控制的模型有兩大類。一類是預測預報模型,通常採用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術。另一類是描述性模型,通常採用聚類分析的建模技術。
· 進行數值分類,構造分類模式。在多變數系統的分析中,往往需要將系統性質相似的事物或現象歸為一類。以便找出它們之間的聯系和內在規律性。過去許多研究多是按單因素進行定性處理,以致處理結果反映不出系統的總的特徵。進行數值分類,構造分類模式一般採用聚類分析和判別分析技術。
如何選擇適當的方法來解決實際問題,需要對問題進行綜合考慮。對一個問題可以綜合運用多種統計方法進行分析。例如一個預報模型的建立,可先根據有關生物學、生態學原理,確定理論模型和試驗設計;根據試驗結果,收集試驗資料;對資料進行初步提煉;然後應用統計分析方法(如相關分析、逐步回歸分析、主成分分析等)研究各個變數之間的相關性,選擇最佳的變數子集合;在此基礎上構造預報模型,最後對模型進行診斷和優化處理,並應用於生產實際。
Rotated Component Matrix,就是經轉軸後的因子負荷矩陣,
當你設置了因子轉軸後,便會產生這結果。
轉軸的是要得到清晰的負荷形式,以便研究者進行因子解釋及命名。
SPSS的Factor Analysis對話框中,有個Rotation鈕,點擊便會彈出Rotation對話框,
其中有5種因子旋轉方法可選擇:
1.最大變異法(Varimax):使負荷量的變異數在因子內最大,亦即,使每個因子上具有最高載荷的變數數最少。
2.四次方最大值法(Quartimax):使負荷量的變異數在變項內最大,亦即,使每個變數中需要解釋的因子數最少。
3.相等最大值法(Equamax):綜合前兩者,使負荷量的變異數在因素內與變項內同時最大。
4.直接斜交轉軸法(Direct Oblimin):使因素負荷量的差積(cross-procts)最小化。
5.Promax 轉軸法:將直交轉軸(varimax)的結果再進行有相關的斜交轉軸。因子負荷量取2,4,6次方以產生接近0但不為0的值,藉以找出因子間的相關,但仍保有最簡化因素的特性。
上述前三者屬於「直交(正交)轉軸法」(Orthogonal Rotations),在直交轉軸法中,因子與因子之間沒有相關,因子軸之間的夾角等於90 度。後兩者屬於「斜交轉軸」(oblique rotations),表示因子與因子之間彼此有某種程度的相關,因素軸之間的夾角不是90度。
直交轉軸法的優點是因子之間提供的訊息不會重疊,受訪者在某一個因子的分數與在其他因子的分數,彼此獨立互不相關;缺點是研究迫使因素之間不相關,但這種情況在實際的情境中往往並不常存在。至於使用何種轉軸方式,須視乎研究題材、研究目的及相關理論,由研究者自行設定。
在根據結果解釋因子時,除了要看因子負荷矩陣中,因子對哪些變數呈高負荷,對哪些變數呈低負荷,還須留意之前所用的轉軸法代表的意義。
2,主成分分析(principal component analysis)
將多個變數通過線性變換以選出較少個數重要變數的一種多元統計分析方法。又稱主分量分析。在實際課題中,為了全面分析問題,往往提出很多與此有關的變數(或因素),因為每個變數都在不同程度上反映這個課題的某些信息。但是,在用統計分析方法研究這個多變數的課題時,變數個數太多就會增加課題的復雜性。人們自然希望變數個數較少而得到的信息較多。在很多情形,變數之間是有一定的相關關系的,當兩個變數之間有一定相關關系時,可以解釋為這兩個變數反映此課題的信息有一定的重疊。主成分分析是對於原先提出的所有變數,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息。主成分分析首先是由K.皮爾森對非隨機變數引入的,爾後H.霍特林將此方法推廣到隨機向量的情形。信息的大小通常用離差平方和或方差來衡量。
(1)主成分分析的原理及基本思想。
原理:設法將原來變數重新組合成一組新的互相無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的總和變數盡可能多地反映原來變數的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上處理降維的一種方法。
基本思想:主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標。通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F1已有的信息就不需要再出現再F2中,用數學語言表達就是要求Cov(F1, F2)=0,則稱F2為第二主成分,依此類推可以構造出第三、第四,……,第P個主成分。
(2)步驟
Fp=a1mZX1+a2mZX2+……+apmZXp
其中a1i, a2i, ……,api(i=1,……,m)為X的協方差陣∑的特徵值多對應的特徵向量,ZX1, ZX2, ……, ZXp是原始變數經過標准化處理的值,因為在實際應用中,往往存在指標的量綱不同,所以在計算之前須先消除量綱的影響,而將原始數據標准化,本文所採用的數據就存在量綱影響[註:本文指的數據標准化是指Z標准化]。
A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R為相關系數矩陣,λi、ai是相應的特徵值和單位特徵向量,λ1≥λ2≥…≥λp≥0 。
進行主成分分析主要步驟如下:
1. 指標數據標准化(SPSS軟體自動執行);
2. 指標之間的相關性判定;
3. 確定主成分個數m;
4. 主成分Fi表達式;
5. 主成分Fi命名;
選用以上兩種方法時的注意事項如下:
1、因子分析中是把變數表示成各因子的線性組合,而主成分分析中則是把主成分表示成個變數的線性組合。
2、主成分分析的重點在於解釋個變數的總方差,而因子分析則把重點放在解釋各變數之間的協方差。
3、主成分分析中不需要有假設(assumptions),因子分析則需要一些假設。因子分析的假設包括:各個共同因子之間不相關,特殊因子(specific factor)之間也不相關,共同因子和特殊因子之間也不相關。
4、主成分分析中,當給定的協方差矩陣或者相關矩陣的特徵值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉得到不同的因子。
5、在因子分析中,因子個數需要分析者指定(spss根據一定的條件自動設定,只要是特徵值大於1的因子進入分析),而指定的因子數量不同而結果不同。在主成分分析中,成分的數量是一定的,一般有幾個變數就有幾個主成分。和主成分分析相比,由於因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優勢。大致說來,當需要尋找潛在的因子,並對這些因子進行解釋的時候,更加傾向於使用因子分析,並且藉助旋轉技術幫助更好解釋。而如果想把現有的變數變成少數幾個新的變數(新的變數幾乎帶有原來所有變數的信息)來進入後續的分析,則可以使用主成分分析。當然,這中情況也可以使用因子得分做到。所以這中區分不是絕對的。
總得來說,主成分分析主要是作為一種探索性的技術,在分析者進行多元數據分析之前,用主成分分析來分析數據,讓自己對數據有一個大致的了解是非常重要的。主成分分析一般很少單獨使用:a,了解數據。(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當變數很多,個案數不多,直接使用判別分析可能無解,這時候可以使用主成份發對變數簡化。(rece dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數),還可以用來處理共線性。
在演算法上,主成分分析和因子分析很類似,不過,在因子分析中所採用的協方差矩陣的對角元素不在是變數的方差,而是和變數對應的共同度(變數方差中被各因子所解釋的部分)。
(1)了解如何通過SPSS因子分析得出主成分分析結果。首先,選擇SPSS中Analyze-Data Rection-Factor…,在Extraction…對話框中選擇主成分方法提取因子,選擇好因子提取個數標准後點確定完成因子分析。打開輸出結果窗口後找到Total Variance Explained表和Component Matrix表。將Component Matrix表中第一列數據分別除以Total Variance Explained表中第一特徵根值的開方得到第一主成分表達式系數,用類似方法得到其它主成分表達式。打開數據窗口,點擊菜單項的Analyze-Descriptive Statistics-Descriptives…,在打開的新窗口下方構選Save standardized values as variables,選定左邊要分析的變數。點擊Options,只構選Means,點確定後既得待分析變數的標准化新變數。
選擇菜單項Transform-Compute…,在Target Variable中輸入:Z1(主成分變數名,可以自己定義),在Numeric Expression中輸入例如:0.412(剛才主成分表達式中的系數)*Z人口數(標准化過的新變數名)+0.212*Z第一產業產值+…,點確定即得到主成分得分。通過對主成分得分的排序即可進行各個個案的綜合評價。很顯然,這里的過程分為四個步驟:
Ⅰ.選主成分方法提取因子進行因子分析。
Ⅱ.計算主成分表達式系數。
Ⅲ.標准化數據。
Ⅳ.計算主成分得分。
我們的程序也將依該思路展開開發。
(2)對為何要將Component Matrix表數據除以特徵根開方的解釋
我們學過主成分分析和因子分析後不難發現,原來因子分析時的因子載荷矩陣就是主成分分析特徵向量矩陣乘以對應特徵根開方值的對角陣。而Component Matrix表輸出的恰是因子載荷矩陣,所以求主成分特徵向量自然是上面描述的逆運算。
成功啟動程序後選定分析變數和主成分提取方法即可在數據窗口輸出得分和在OUTPUT窗口輸出主成分表達式。
3,聚類分析(Cluster Analysis)
聚類分析是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類的分析技術 。
在市場研究領域,聚類分析主要應用方面是幫助我們尋找目標消費群體,運用這項研究技術,我們可以劃分出產品的細分市場,並且可以描述出各細分市場的人群特徵,以便於客戶可以有針對性的對目標消費群體施加影響,合理地開展工作。
4.判別分析(Discriminatory Analysis)
判別分析(Discriminatory Analysis)的任務是根據已掌握的1批分類明確的樣品,建立較好的判別函數,使產生錯判的事例最少,進而對給定的1個新樣品,判斷它來自哪個總體。根據資料的性質,分為定性資料的判別分析和定量資料的判別分析;採用不同的判別准則,又有費歇、貝葉斯、距離等判別方法。
費歇(FISHER)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個適當的投影軸,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內的投影值所形成的類內離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。貝葉斯(BAYES)判別思想是根據先驗概率求出後驗概率,並依據後驗概率分布作出統計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂後驗概率,就是根據具體資料、先驗概率、特定的判別規則所計算出來的概率。它是對先驗概率修正後的結果。
距離判別思想是根據各樣品與各母體之間的距離遠近作出判別。即根據資料建立關於各母體的距離判別函數式,將各樣品數據逐一代入計算,得出各樣品與各母體之間的距離值,判樣品屬於距離值最小的那個母體。
5.對應分析(Correspondence Analysis)
對應分析是一種用來研究變數與變數之間聯系緊密程度的研究技術。
運用這種研究技術,我們可以獲取有關消費者對產品品牌定位方面的圖形,從而幫助您及時調整營銷策略,以便使產品品牌在消費者中能樹立起正確的形象。
這種研究技術還可以用於檢驗廣告或市場推廣活動的效果,我們可以通過對比廣告播出前或市場推廣活動前與廣告播出後或市場推廣活動後消費者對產品的不同認知圖來看出廣告或市場推廣活動是否成功的向消費者傳達了需要傳達的信息。
⑸ 多元統計分析與統計分析的區別是什麼差不多嗎
多元統計分析是從經典統計學中發展起來的一個分支,是一種綜合分析方法,它能夠在多個對象和對個指標互相關聯的情況下分析它們的統計規律,很適合農業科學研究的特點。主要內容包括多元正態分布及其抽樣分布、多元正態總體的均值向量和協方差陣的假設檢驗、多元方差分析、直線回歸與相關、多元線性回歸與相關(Ⅰ)和(Ⅱ)、主成分分析與因子分析、判別分析與聚類分析、Shannon信息量及其應用。簡稱多元分析。當總體的分布是多維(多元)概率分布時,處理該總體的數理統計理論和方法。數理統計學中的一個重要的分支學科
統計分析是指運用統計方法及與分析對象有關的知識,從定量與定性的結合上進行的研究活動。它是繼統計設計、統計調查、統計整理之後的一項十分重要的工作,是在前幾個階段工作的基礎上通過分析從而達到對研究對象更為深刻的認識。它又是在一定的選題下,集分析方案的設計、資料的搜集和整理而展開的研究活動。系統、完善的資料是統計分析的必要條件
⑹ 多元統計分析方法的作用是什麼
多元統計分析方法的作用使實際工作者利用多元統計分析方法解決實際問題更簡單方便。
如果每個個體有多個觀測數據,或者從數學上說,如果個體的觀測數據能表為P維歐幾里得空間的點,那麼這樣的數據叫做多元數據,而分析多元數據的統計方法就叫做多元統計分析,它是數理統計學中的一個重要的分支學科。
典型相關分析
它是尋求兩組變數各自的線性函數中相關系數達到最大值的一對,這稱為第一對典型變數,還可以求第二對,第三對,等等,這些成對的變數,彼此是不相關的。各對的相關系數稱為典型相關系數。通過這些典型變數所代表的實際含意,可以找到這兩組變數間的一些內在聯系。典型相關分析雖然30年代已經出現,但至今未能廣泛應用。