Ⅰ 16種常用的數據分析方法-列聯分析
列聯分析通常用來分析兩個分類變數之間或者一個分類變數與順序變數之間是否存在關聯,關聯的緊密程度如何。
對關聯性問題的處理稱為獨立性檢驗(Test of Independence),通過交叉列聯表和 c2 檢驗進行列聯分析。
交叉列聯表分為二維表與三維表兩種,二維表交叉表可進行卡方檢驗,三維交叉表,可作Mentel-Hanszel分層分析。
列聯表結構
2*2 列聯表
r *c 列聯表
案例
公司在4個不同的地區設有分公司,公司准備進行工資級別調整。採用抽樣調查方式,從4個分公司共抽取420個樣本 (人),了解職工對此調整的看法,交叉統計結果如下:
觀察頻數分布表&百分比分布表的分布
列聯交叉表中的統計值有兩種類型:頻數與百分比,對於兩種類型的分布表,觀察其分布時,要注意:
一、頻數分布表
1、觀察邊緣分布
行邊緣分布:行觀察值的合計數的分布
列邊緣分布:列觀察值的合計數的分布
2、觀察條件分布與條件頻數
變數 X 條件下變數 Y 的分布,或在變數 Y 條件下變數 X 的分布
每個具體的觀察值稱為條件頻數
二、百分比分布
為在相同的基數上進行比較,可以計算相應的百分比,稱為 百分比分布
1、觀察行百分比:行的每一個觀察頻數除以相應的行合計數( fij / ri )
2、觀察列百分比:列的每一個觀察頻數除以相應的列合計數( fij / cj )
3、觀察總百分比:每一個觀察值除以觀察值的總個數( fij / n )
交叉列聯表分析步驟
1.【分析】—【描述統計】—【交叉表】
【精確】
一般情況下,"精確檢驗"(Exact Tests)對話框的選項都默認為系統默認值,不作調整。
【統計量】
【單元格】
【格式】
2.結果分析:
卡方檢驗
a. 16 單元格(100.0%) 的期望計數少於 5。最小期望計數為 .56。
原假設:H0:職稱、學歷兩者相互獨立。
皮爾遜(Pearson)的Chi-Square 值為18.553,自由度為9,
p=.029<0.05,拒絕原假設,即在5%的顯著性水平下不同文化程度對職稱的影響存在著顯著差異。
結論:文化程度越高,職稱越高。
Ⅱ 如何使用spss進行交叉列聯表分析
SPSS提供了多種適用於不同類型數據的相關系數表達,這些相關性檢驗的零假設都是:行和列變數之間相互獨立,不存在顯著的相關關系。根據SPSS檢驗後得出的相伴概率(Concomitant Significance)判斷是否存在相關關系。如果相伴概率小於顯著性水平0.05,那麼拒絕零假設,行列變數之間彼此相關;如果相伴概率大於顯著性水平0.05,那麼接受原假設,行列變數之間彼此獨立。
在交叉列聯表分析中,SPSS所提供的相關關系的檢驗方法主要有以下3種:
(1)卡方(χ2)統計檢驗:常用於檢驗行列變數之間是否相關。計算公式為:
在該對話框中,用戶可以指定列聯表的輸出排列順序。對話框中各選項的具體意義如下:
在行序(Row Order)欄中有如下兩個選項:
升序(Ascending):系統默認,以升序顯示各變數值;
降序(Descending):以降序顯示各變數值。
用戶在該對話框中進行選擇後,單擊【繼續】(Continue)按鈕,即可返回"交叉表"主對話框。
在"交叉表"對話框中單擊【確定】(OK)按鈕,可在輸出窗口中得到數據概述、交叉列聯表、卡方檢驗表、交叉分組下頻率分布柱形圖、相對危險性估計等圖表。
Ⅲ 如何使用spss進行交叉列聯表分析
1、首先我們打開之前導入的spps文件。
Ⅳ 如何使用spss進行交叉列聯表分析
在實際分析中,除了需要對單個變數的數據分布情況進行分析外,還需要掌握多個變數在不同取值情況下的數據分布情況,從而進一步深入分析變數之間的相互影響和關系,這種分析就稱為交叉列聯表分析。
當所觀察的現象同時與兩個因素有關時,如某種服裝的銷量受價格和居民收入的影響,某種產品的生產成本受原材料價格和產量的影響等,通過交叉列聯表分析,可以較好地反映出這兩個因素之間有無關聯性及兩個因素與所觀察現象之間的相關關系。
因此,數據交叉列聯表分析主要包括兩個基本任務:一是根據收集的樣本數據,產生二維或多維交叉列聯表;二是在交叉列聯表的基礎上,對兩個變數間是否存在相關性進行檢驗。要獲得變數之間的相關性,僅僅靠描述性統計的數據是不夠的,還需要藉助一些表示變數間相關程度的統計量和一些非參數檢驗的方法。
常用的衡量變數間相關程度的統計量是簡單相關系數,但在交叉列聯表分析中,由於行列變數往往不是連續變數,不符合計算簡單相關系數的前提條件。因此,需要根據變數的性質選擇其他的相關系數,如Kendall等級相關系數、Eta值等。
SPSS提供了多種適用於不同類型數據的相關系數表達,這些相關性檢驗的零假設都是:行和列變數之間相互獨立,不存在顯著的相關關系。根據SPSS檢驗後得出的相伴概率(Concomitant Significance)判斷是否存在相關關系。如果相伴概率小於顯著性水平0.05,那麼拒絕零假設,行列變數之間彼此相關;如果相伴概率大於顯著性水平0.05,那麼接受原假設,行列變數之間彼此獨立。
Ⅳ 統計分析方法有哪些