A. spss分析方法-卡方檢驗
參數檢驗的前提是 關於總體分布的假設成立 ,但很多情況下我們無法獲得有關總體分布的相關信息。
非參數檢驗正是一類基於這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。
卡方檢驗是一種用於 判斷樣本是否來自於特定分布的總體 的 非參數檢驗 方法,其根據樣本的頻數來推斷總體分布與理論分布是否有顯著差異。
下面我們主要從下面四個方面來解說:
實際應用
理論思想
操作過程
分析結果
一、實際應用
例如抽取某學校的學生的數據,推斷性別比例是否4:6;醫學家在研究心臟病人猝死人數與日期的關系時發現:一周之中,星期一心臟病人猝死者較多,其他日子則基本相當。當天的比例近似為2.8:1:1:1:1:1:1。現收集到心臟病人死亡日期的樣本數據,推斷其總體分布是否與上述理論分布相吻合。
二、理論思想
卡方檢驗方法可以根據樣本數據,推斷總體分布與期望分布或某一理論分布是否存在顯著差異,是一種吻合性檢驗,通常適於對有多項分類值的總體分布的分析。H0原假設是: 樣本來自的總體分布與期望分布或某一理論分布無差異 。
三、操作過程
卡方檢驗的數據條件:
條件寬松、對樣本數據要求較低、計算相對簡單
卡方檢驗案例:
題目:隨機抽取的100名山東省某地區新出生嬰兒的性別情況。試用卡方檢驗方法研究該地區新出生嬰兒的男女比例是否存在明顯的差別。
一、數據輸入
二、操作步驟
1.進入SPSS,打開相關數據文件,選擇「分析」「|非參數檢驗」「|舊對話框」|「卡方」命令
2.選擇進行卡方檢驗的變數。在「卡方檢驗」對話框的左側列表框中,選擇「性別」進入「檢驗變數列表」列表框。
3.設置期望范圍和期望值。在「卡方檢驗」對話框內的「期望范圍」選項組中,選中「從數據中獲取」單選按鈕,也就是根據數據本身的最大值和最小值來確定檢驗值范圍;在「期望值」選項組中,選中「所有類別相等」單選按鈕,因為本例中各類別的構成比相同。
4.設定卡方檢驗的計算方法。單擊「卡方檢驗」對話框中的「精確」按鈕,選中「僅漸進法」單選按鈕,單擊「繼續」按鈕返回「卡方檢驗」對話框。
選擇相關統計量的輸出和缺失值的處理方法。
5.單擊「卡方檢驗」對話框中的「選項」按鈕,在「統計」選項組中選中「描述」復選框,也就是輸出變數的描述性統計量,包括平均值、標准差、最大值、最小值等;在「缺失值」選項組中選中「按檢驗排除個案」單選按鈕,即排除掉含有缺失值的記錄後再進行卡方檢驗。設置完畢後,單擊「繼續」按鈕返回「卡方檢驗」對話框。
6.其餘設置採用系統默認值即可。
7.單擊「確定」按鈕,等待輸出結果。
四、結果分析
1. 描述性統計量表接受檢驗的樣本共100個,樣本平均值是1.49,標准差是0.502,最小值是1,最大值是2。
2. 卡方檢驗頻數表參與檢驗的男性嬰兒共51個,女性嬰兒共49個,期望數都是50.0,殘差分別是1.0和-1.0。
3. 卡方檢驗統計量表卡方值是0.040,自由度是1,漸近顯著性水平為0.841,遠大於0.05,檢驗結果接受原假設。
分析結論:
綜上所述,通過卡方檢驗,該地區新出生嬰兒的男女比例沒有明顯的差別。
(獲取更多知識,前往前往我的wx ————公z號 (程式解說)
原文來自https://mp.weixin.qq.com/s/4HW9cWF96yG7GKre5OFNHQ
B. 卡方檢驗研究的方法
1、處理四格表數據時不考慮樣本量和最小理論頻數而直接採用卡方檢驗
處理四格表數據是卡方檢驗最為常見的用途之一,其目的在於分析「構成比」或者「率」上的差異是否具有統計學意義。對於四格表數據,使用卡方檢驗的條件為樣本量大於 40,且最小理論頻數應大於 5。對於某些小樣本的、或者指標陽性率較低的研究,總樣本量可能小於 40,最小理論頻數也可能小於 5,此時應該採用 Fisher 確切概率法進行分析。
比如某研究需比較小細胞肺癌和非小細胞肺癌內某個基因的表達情況的差異是否有統計學意義,得出如下四格表:
該研究的樣本量僅為 30 個,且最小理論頻數為(12×9)/30=3.6,所以應該採用 Fisher 確切概率法進行分析。實際上,從理論上講,若要分析四格表數據中的構成比或者率之間的差異是否有統計學意義,Fisher 確切概率法的結果是最可靠的。若是使用軟體對數據進行分析,不論樣本量和最小理論頻數,均可採用 Fisher 確切概率法。
2、不考慮分析目的、設計類型而盲目套用卡方檢驗
有的四格表資料本身是配對的,且研究的目的主要是回答「一致性」或者「不一致性」的問題,此時就不應該用卡方檢驗對數據進行分析。比如:某研究者發明了一種新的 HIV 檢測法,並且用該法和免疫印跡法(檢測 HIV 感染的「金標准」)同時檢測了 100 份血清,得到如下四格表數據:
該研究在設計上與表 1 中的研究最大的區別在於「配對」,即同一樣本分別接受了新方法檢測和免疫印跡法(金標准)的檢測。研究者最關心的問題應該是「新方法和金標准之間的一致性」問題,若採用卡方檢驗進行分析,得出的結論是「免疫印跡法檢測結果的頻數分布在新方法陽性組和陰性組中是不同的」,這一結論顯然並無多大專業價值。
對於此類研究,可以採用兩種方法進行統計,一是採用 Mcnemar χ2 檢驗公式計算兩種方法不一致的部分是否具有統計學意義;二是採用 Kappa 檢驗分析兩種結果之間的一致性。
需要說明的是,此類研究中的一種方法必須是金標准,否則研究可能沒有價值。以表 2 中的數據為例,若免疫印跡法並非檢測 HIV 感染的金標准,兩種方法的一致性即使好得一塌糊塗,也可能無濟於事。
因為一個顯而易見的問題是:這兩種方法可能都是錯誤的檢測方法。比如:採用金標准對 100 份血清進行檢測後,其中 90 例為陽性,而不論是新方法還是免疫印跡法,均僅僅檢測出了 55 個陽性樣本,漏檢率顯然太高。
3、誤用卡方檢驗處理等級資料
等級資料的表示方法與分類資料相似,因此受「定式思維」的影響,部分同行「習慣性」地採用卡方檢驗對等級資料進行處理,這也是醫學期刊上最常見的濫(亂)用卡方檢驗的行為。卡方檢驗回答的問題僅僅是「構成比」或者「率」上的差異是否具有統計學意義,而不能回答效應指標的強度高低問題。比如某研究比較了兩類人群胰腺癌分期的分布狀況,如下表所示:
此類數據的一個顯著特點是胰腺癌的分期(Ⅰ、Ⅱ、Ⅲ、Ⅳ期)是一個等級資料,研究者的研究目的是分析甲乙兩群人胰腺癌的分期是否有差別,是一個強度「分期早晚」的問題,而不是「構成比」的差異。若用卡方檢驗處理此類數據,得出的結論就是「甲乙兩類人群胰腺癌分期構成比上的差異是否具有統計學意義」,而無法明確「孰高孰低」的問題。
以上述表格為例,卡方檢驗結果顯示有統計學意義,但問題在於:根據表中數據,人群甲以Ⅰ期和Ⅳ期為主,人群乙以Ⅱ期和Ⅲ期為主,讓人完全無法判斷兩類人群的疾病分期「孰早孰晚」的問題。
處理此類數據的一般方法是將分期進行秩轉換,然後以秩和檢驗進行統計分析,也可以直接採用 Riddit 分析進行統計。
4、對於多組資料反復使用卡方檢驗進行比較
又是研究者面對的數據可能有多行或者多列(R×C 資料),研究者需要逐一比較各組數據的差異是否有統計學意義。比如某研究者對不同血型的個體患乙型肝炎的情況進行了調查,得出如下數據:
這是一個率的比較問題,研究目的主要在於分析各個血型的人群 HBV 感染的發病率是否相同。處理此類數據,一般是直接採用卡方檢驗從整體上分析各組人群率(構成比)上的差異是否具有統計學意義;若具有統計學意義,則根據研究目的進一步覺得是否進行組間的比較。
以本研究為例,研究者可能還需要逐一比較各組 HBV 感染的發病率之間的差異是否具有統計學意義。處理此類數據時,最容易犯的一類錯誤就是將表格進行拆分成六個四格表反復採用卡方檢驗進行統計分析。實際上,這種錯誤的統計學方法類似於「反復使用 t 檢驗比較多組資料」,會增大Ⅰ類誤差的概率。正確的做法應該是採用卡方分割法,通過改校正驗水準的方式來進行兩兩比較。
需要說明的是,在整體比較之後是否需要進行兩兩比較,如何進行兩兩比較在很大程度上取決於專業需要,或者說研究目的,特別是分組因素的「屬性」是否相同。比如某研究欲分析了基因 A 在類風濕性關節炎中的表達情況(基因表達情況以陽性和陰性進行描述),除了健康對照外,研究者還設立了疾病對照組,包括系統性紅斑狼瘡和乾燥綜合症。