導航:首頁 > 研究方法 > 多變數相關分析方法

多變數相關分析方法

發布時間:2024-06-28 23:17:50

1. 正確選擇相關性分析的統計方法

轉自: https://www.medsci.cn/article/show_article.do?id=55c91839569a

相關性分析主要用於:(1)判斷兩個或多個變數之間的統計學關聯;(2)如果存在關聯,進一步分析關聯強度和方向。

那麼,什麼樣的研究可以進行相關性分析呢?我們在這里列舉了幾個相關性研究的例子供大家參考:

確定要進行相關性分析後,對兩個變數或多個變數進行相關性分析所採取的統計方法是不同的。那麼,怎麼判斷研究變數的數量呢?

我們分別就兩個變數的研究和三個及以上變數的研究進行了舉例,幫助大家理解。同時,我們也對例子中變數數據類型進行了描述(如,連續變數、二分類變數、無序分類變數和有序分類變數)。

確定擬分析變數之間的相關性後,我們需要判斷變數的數據類型。

變數的數據類型主要分為連續變數、二分類變數、無序分類變數和有序分類變數4類。擬分析的變數可以同屬於一個數據類型,也可以分屬不同的數據類型。根據這兩個變數數據類型的不同,應採用的統計分析方法也不同。

連續變數是指對連續的指標測量所得到的數值,比如體重。其特點是等距區間的差異相同,例如體重在50kg-60kg之間的差異與60kg-70kg之間的差異相同。連續變數的示例如下:

有序分類變數可以有兩個或者多個已排序的類別。舉例來說,如果某患者的治療結果是「痊癒」、「好轉」、「不變」或者「惡化」。這就是一個有序分類變數,因為可以對四個類別進行排序。

需要注意的是,雖然我們可以對有序分類變數的類別排序,但還需要判斷這種類別排序是不是等距的。例如,用各年齡段的近似中位數代表年齡類別,即24(18-30)歲、40(31-50)歲、60(51-70)歲、80(70歲以上)歲,可以將年齡視為定距變數。

但將患者的診療結果「痊癒」、「好轉」、「無變化」或者「惡化」就不能認為是等距的,換句話說,不能認為「好轉」是「無變化」的2倍;也不能認為「痊癒」和「好轉」的差異與「不變」和「惡化很滿意」的差異一樣,即有序分類變數各類別之間不是可能是定距、也可能不是定距的,這是與連續變數的根本不同。有序分類變數的示例如下:

患者對醫療效果的滿意程度,用5類測量:1-非常不滿意、2-不滿意、3-一般、4-滿意、5-非常滿意

對疾病的療效:用4類測量:1-痊癒、2-好轉、3-不變、4-變差

BMI指數是一種用於評估體重水平的指標。一般來說,BMI是連續變數(例如BMI為23.7或BMI為34.1),但按以下方式分類時可以視為有序分類變數:體重過輕(BMI小於18.5)、健康/正常體重(BMI在18.5—23.9之間)、超重(BMI在24—27.9之間)和肥胖(BMI大於28)。

二分類變數是只有兩個類別的分類變數。二分類變數的類別之間沒有順序,不能像有序分類變數的類別那樣進行排序。比如,性別變數就是一個二分類變數,可以分為「男性」和「女性」兩個分類。再如,罹患心臟病也是一個二分類變數,分為「是」和「否」兩個分類。

二分類變數類別是互斥的,一個研究對象不能同時分屬於兩個類別,比如一個人不能同時是男性或者女性,也不能同時患有心臟病又沒有心臟病。二分類變數的示例如下:

性別,兩個類別:男性或女性

罹患心臟病,兩個類別:是或否

研究分組,兩個類別:實驗組或對照組

無序分類變數是具有三個及以上類別的分類變數。無序分類變數的類別之間沒有內在順序,也不能像有序分類變數類別那樣進行排序。比如,出行方式是一個典型的無序分類變數,可以分為自行車、自駕、計程車、地鐵或公交5個類別。無序分類變數的類別也是互斥的,一個研究對象不能同時分屬於不同的類別,比如一次出行不能同時坐地鐵又自己開車。無序分類變數的示例如下:

手機品牌,四個類別:蘋果、三星、華為或其他

頭發的顏色,五個類別:棕色、黑色、金色、紅色或者灰色

民族,七個類別:漢族、回族、蒙古族、滿族、維吾爾族、朝鮮族或其他

自變數也稱為預測變數或解釋變數,因變數也稱為應答變數或結局變數。兩者的區分在於,自變數可以影響因變數,因變數的值取決於對應自變數的值。也可以用因果關系來區分自變數和因變數,即自變數的變化導致了因變數的變化(但自變數和因變數之間並不一定真的存在因果關系)。自變數是對因變數的描述,而因變數可以被自變數所解釋。

研究設計也可以幫助我們區分自變數和因變數。舉例來說,我們計劃開展一項研究分析不同劑量葯物的治療效果,治療葯物就是這個研究的自變數,治療效果則是因變數。

比如我們想知道抗感染葯物劑量(1.5 mg / d、4 mg /d或者 8 mg/d)與患者發熱時長的關系,抗感染葯物劑量就是自變數,因為這個劑量的是由研究者干預產生的,且很可能是發熱時長差異的原因;而同時發熱時長就是這項研究的因變數。

橫斷面調查並不區分自變數和因變數。舉例來說,研究者根據問卷調查研究對象的工作效率(1-5類:1代表非常高效、5代表非常低效)和鍛煉情況(1-4類:1代表經常鍛煉、4代表不鍛煉)的關系。

在該研究中,受調查者的工作效率和鍛煉情況並不存在明確的因果關系,因為效率高可能意味著受調查者有更多的鍛煉時間,而反之經常鍛煉可能也會提高工作效率。因此,我們就不區分該研究的自變數和因變數。

本文先說說研究中涉及兩個變數的情況。

Pearson相關用於評估兩個連續變數之間的線性關聯強度。這種統計方法本身不區分自變數和因變數,但如果您根據研究背景已經對變數進行了區分,我們仍可以採用該方法判斷相關性。

Pearson相關不區分自變數和因變數。雖然這不影響我們採用Pearson相關分析兩個連續變數的相關性,但如果還是想通過統計方法區分一下,可以採用線性回歸。

這里還需要判斷有序分類變數是否為定距變數。如果認為擬分析的有序分類變數是定距變數,我們就可以為變數中的類別賦值,然後根據這些數值進行分析(即看作連續變數),比如測量滿意度(從「完全同意」到「完全不同意」5個類別)就是一個定距變數,可以用1-5為各類別賦值,即1 =完全同意、2 =同意、3 =一般、4 =不同意、5 =完全不同意。

對於不能作為定距變數的有序分類變數,比如軍銜的類別(少將、中將、上將、大將等)之間就不是等距的,就不能賦值後對數值進行分析(只能對類別進行分析)。

實際上,將有序分類變數作為連續變數進行分析,這在大多數情況下可能不符合我們的研究目的。對類別進行分析是對有序分類變數相關性分析的常見選擇。但是,如果基於的研究背景,待分析的有序分類變數確實可以作為定距變數處理,也是可以的。

Mantel-Haenszel 趨勢檢驗。該檢驗也被稱為Mantel-Haenszel 卡方檢驗、Mantel-Haenszel 趨勢卡方檢驗。該檢驗根據研究者對有序分類變數類別的賦值,判斷兩個有序分類變數之間的線性趨勢。

Spearman相關又稱Spearman秩相關,用於檢驗至少有一個有序分類變數的關聯強度和方向。

Kendall's tau-b 相關系數是用於檢驗至少有一個有序分類變數關聯強度和方向的非參數分析方法。該檢驗與Spearman相關的應用范圍基本一致,但更適用於存在多種關聯的數據(如列聯表)。

卡方檢驗常用於分析無序分類變數之間的相關性,也可以用於分析二分類變數之間的關系。但是該檢驗只能分析相關的統計學意義,不能反映關聯強度。因此,我們常聯合Cramer's V檢驗提示關聯強度。

Fisher精確檢驗可以用於檢驗任何R C數據之間的相關關系,但最常用於分析2 2數據,即兩個二分類變數之間的相關性。與卡方檢驗只能擬合近似分布不同的是,Fisher精確檢驗可以分析精確分布,更適合分析小樣本數據。但是該檢驗與卡方檢驗一樣,只能分析相關的統計學意義,不能反映關聯強度。

確定進行兩個二分類變數的相關性分析後,我們需要判斷是否區分自變數和因變數。

相對風險是流行病學或前瞻性隊列研究中的常用指標,可以在一定條件下比較兩個比例之間的關系,但其提示的結果是比值而不是差異。

比值比可以計算多類研究的關聯強度,也是很多統計檢驗(如二分類logistic回歸)的常用指標。在相對風險指標不適用的病例對照研究中,比值比仍可以很好地反映結果。

卡方檢驗可用於分析兩個二分類變數之間的關系。但是該檢驗只能分析相關的統計學意義,不能反映關聯強度。因此,該檢驗可以聯合Phi (φ)系數提示關聯強度。

Fisher精確檢驗可以用於檢驗任何R C數據之間的關系,但最常用於分析2 2數據,即兩個二分類變數之間的相關性。與卡方檢驗只能擬合近似分布不同的是,Fisher精確檢驗可以分析數據的精確分布,更適用於小樣本數據。但是該檢驗與卡方檢驗一樣,只能分析相關的統計學意義,不能反映關聯強度。

Point-biserial相關。Point-biserial相關適用於分析二分類變數和連續變數之間的相關性。其實,該檢驗是Pearson相關的一種特殊形式,與Pearson相關的數據假設一致,也可以在SPSS中通過Pearson相關模塊進行計算,我們會在教程中具體介紹。

確定進行二分類變數和有序分類變數的相關性分析後,我們需要判斷是否區分自變數和因變數:

有序Logistic回歸。有序Logistic回歸在本質上並不是為了分析二分類變數和有序分類變數之間的相關性。但我們仍可以用有序logistic回歸及其對應的OR值判斷這兩類變數之間的統計學關聯。

Cochran-Armitage 檢驗。Cochran-Armitage 檢驗又稱Cochran-Armitage 趨勢檢驗,常用於分析有序分類自變數和二分類因變數之間的線性趨勢。該檢驗可以判斷隨著有序分類變數的增加,二分類因變數比例的變化趨勢,是對其線性趨勢的統計學分析。我們將在教程中進一步解釋這一問題。

此問題可以使用Mantel-Haenszel卡方檢驗或Cochran-Armitage趨勢檢驗。Mantel-Haenszel卡方檢驗也稱線性趨勢檢驗(Test for Linear Trend)或定序檢驗(Linear by Linear Test)。

Mantel-Haenszel卡方檢驗和Cochran-Armitage趨勢檢驗的區別是:Mantel-Haenszel卡方檢驗要求一個變數是有序分類變數,另一個變數可以是二分類變數,也可以是有序多分類變數。而Cochran-Armitage趨勢檢驗要求一個變數是有序分類變數,另一個變數是二分類變數。

SPSS不提供Cochran-Armitage趨勢檢驗, Mantel-Haenszel卡方可以得到近似的結果。Cochran-Armitage趨勢檢驗可以在SAS等其它軟體中實現(SAS可以同時提供Cochran-Armitage趨勢檢驗和Mantel-Haenszel卡方檢驗的結果)。

Biserial秩相關:Biserial秩相關可以用於分析二分類變數和有序分類變數之間的相關性。在用二分類變數預測有序分類變數時,該檢驗又稱為Somers' d檢驗。此外,Mann-Whitney U檢驗也可以輸出Biserial秩相關結果。

Spearman相關。沒有適用於分析有序分類變數和連續變數相關性的檢驗方法,我們需要將連續變數視為有序分類變數進行檢驗,即分析兩個有序分類變數之間的關系。在這種情況下,我們可以應用Spearman相關或者其他針對有序分類變數的檢驗方法。

閱讀全文

與多變數相關分析方法相關的資料

熱點內容
c語言編譯連接快捷方法 瀏覽:399
手指震動棒的使用方法 瀏覽:620
泡腳包的正確方法圖片 瀏覽:562
研究物質的重要方法 瀏覽:902
玻璃去除貼紙殘留膠最簡單的方法 瀏覽:859
分開毛線簡便方法 瀏覽:389
九層塔的詳細種植方法 瀏覽:513
畢業論文研究方法如何體現出來 瀏覽:640
大數除法計算簡便方法 瀏覽:810
接地檢測的方法和步驟 瀏覽:503
單開三孔控制安裝方法 瀏覽:445
回風取暖爐如何製作方法 瀏覽:52
問卷相關分析方法 瀏覽:309
賀卡立體的製作方法視頻 瀏覽:574
耳聾有哪些方法治療 瀏覽:879
小金毛弓形蟲治療方法 瀏覽:319
陽其參減肥正確使用方法 瀏覽:824
熟琵琶蝦怎麼保存方法 瀏覽:996
手機淘寶賬號賣家中心在哪裡設置方法 瀏覽:465
計量資料可以用什麼研究方法 瀏覽:230