1. 變異數分析方差分析的基本思想
方差分析的核心思想是通過探究不同來源的變異在總變異中的佔比,來評估可控因素對研究結果影響的大小。讓我們通過一個實例來理解這個概念:
假設在克山病區,我們對比了11名患者的血磷值(mmol/L)與13名健康人的數據:患者組的值為0.84至2.11,健康人組的值為0.54至1.87。我們想了解患者與健康人的血磷值是否有顯著差異。
變異可以分為兩部分:組內變異,即各組內部的隨機誤差導致的血磷值差異;組間變異,由於克山病的影響,兩組的血磷值均數不同。這些變異通過離均差平方和(SS)和自由度(v)來量化,遵循SS總=SS組間+SS組內和v總=v組間+v組內的關系。
方差分析通過比較組內均方與組間均方的比率(F值),來判斷差異的統計學意義。如果F值接近1,表示各組均數差異無統計學意義;如果F值顯著大於1,說明差異具有統計學意義。在實際應用中,我們會查找F界值表來確定特定F值出現的概率。
在使用方差分析前,需要確保數據滿足以下條件:首先,各組數據應具有可比性,即研究對象在其他非分析變數上的條件應相近。其次,數據應呈現正態分布,如果數據偏態,需考慮對數、平方根等變換使其接近正態。最後,方差需要齊性,即各組間的變異程度應一致。可以通過Bartlett法檢驗方差齊性,通過卡方值判斷,查閱卡方界值表來做出結論。
採用拉丁方設計來安排實驗,將兩個控制因素分別安排在拉丁方的行和列上。
2. 統計學怎樣用方差分析方法檢驗有無顯著差異性
什麼是方差分析
方差分析(ANOVA)又稱「變異數分析」或「F檢驗」,是R.A.Fister發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。
由於各種因素的影響,研究所得的數據呈現波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。
一個復雜的事物,其中往往有許多因素互相制約又互相依存。方差分析的目的是通過數據分析找出對該事物有顯著影響的因素,各因素之間的交互作用,以及顯著影響因素的最佳水平等。方差分析是在可比較的數組中,把數據間的總的「變差」按各指定的變差來源進行分解的一種技術。對變差的度量,採用離差平方和。方差分析方法就是從總離差平方和分解出可追溯到指定來源的部分離差平方和,這是一個很重要的思想。
經過方差分析若拒絕了檢驗假設,只能說明多個樣本總體均數不相等或不全相等。若要得到各組均數間更詳細的信息,應在方差分析的基礎上進行多個樣本均數的兩兩比較。
1、多個樣本均數間兩兩比較
多個樣本均數間兩兩比較常用q檢驗的方法,即Newman-kueuls法,其基本步驟為:建立檢驗假設-->樣本均數排序-->計算q值-->查q界值表判斷結果。
2、多個實驗組與一個對照組均數間兩兩比較
多個實驗組與一個對照組均數間兩兩比較,若目的是減小第II類錯誤,最好選用最小顯著差法(LSD法);若目的是減小第I類錯誤,最好選用新復極差法,前者查t界值表,後者查q'界值表。
方差分析的基本思想
基本思想:通過分析研究中不同來源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。
下面我們用一個簡單的例子來說明方差分析的基本思想:
如某克山病區測得11例克山病患者和13名健康人的血磷值(mmol/L)如下:
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
問該地克山病患者與健康人的血磷值是否不同?
從以上資料可以看出,24個患者與健康人的血磷值各不相同,如果用離均差平方和(SS)描述其圍繞總均數的變異情況,則總變異有以下兩個來源:
組內變異,即由於隨機誤差的原因使得各組內部的血磷值各不相等;
組間變異,即由於克山病的影響使得患者與健康人組的血磷值均數大小不等。
而且:SS總=SS組間+SS組內 v總=v組間+v組內
如果用均方(即自由度v去除離均差平方和的商)代替離均差平方和以消除各組樣本數不同的影響,則方差分析就是用組內均方去除組間均方的商(即F值)與1相比較,若F值接近1,則說明各組均數間的差異沒有統計學意義,若F值遠大於1,則說明各組均數間的差異有統計學意義。實際應用中檢驗假設成立條件下F值大於特定值的概率可通過查閱F界值表(方差分析用)獲得。
方差分析的應用條件
應用方差分析對資料進行統計推斷之前應注意其使用條件,包括:
1、可比性。若資料中各組均數本身不具可比性則不適用方差分析。
2、正態性。即偏態分布資料不適用方差分析。對偏態分布的資料應考慮用對數變換、平方根變換、倒數變換、平方根反正弦變換等變數變換方法變為正態或接近正態後再進行方差分析。
3、方差齊性。即若組間方差不齊則不適用方差分析。多個方差的齊性檢驗可用Bartlett法,它用卡方值作為檢驗統計量,結果判斷需查閱卡方界值表。
方差分析主要用於:
1、均數差別的顯著性檢驗;
2、分離各有關因素並估計其對總變異的作用;
3、分析因素間的交互作用;
4、方差齊性檢驗。
方差分析的主要內容
根據資料設計類型的不同,有以下兩種方差分析的方法:
1、對成組設計的多個樣本均數比較,應採用完全隨機設計的方差分析,即單因素方差分析。
2、對隨機區組設計的多個樣本均數比較,應採用配伍組設計的方差分析,即兩因素方差分析。
兩類方差分析的基本步驟相同,只是變異的分解方式不同,對成組設計的資料,總變異分解為組內變異和組間變異(隨機誤差),即:SS總=SS組間+SS組內,而對配伍組設計的資料,總變異除了分解為處理組變異和隨機誤差外還包括配伍組變異,即:SS總=SS處理+SS配伍+SS誤差。整個方差分析的基本步驟如下:
1、建立檢驗假設;
H0:多個樣本總體均數相等;
H1:多個樣本總體均數不相等或不全等。
檢驗水準為0.05。
2、計算檢驗統計量F值;
3、確定P值並作出推斷結果。
3. 應用方差分析時樣本數據應滿足什麼條件
首先看殘差(數據減去均值)是否近似正態。如果是,就可以直接分析。注意方差分析不需要原數據正態,需要殘差近似正態。
其次,方差分析對正態的要求不高。直方圖上中度偏離正態都可接受。或正態概率圖上主觀判斷,大略成一條粗的直線即可。
再次,可以進行數據變換。
看有無方差不齊(常常非正態與方差不齊有關聯)。如有,可以對數據進行冪變換,例如平方,開根號,開四次方,取自然對數,求倒數。直至數據返回正態和等方差,這時殘差也通常會變為正態。
正式的冪變換是用統計軟體做Box-Cox變換。
如果是像發芽率或不良率這種二項分布數據,可以進行arcsin√p變換或ln(p/(1-p))的變換。
如無方差不齊,變換就要適度。因為變換會讓殘差變為正態,但也會讓方差不齊。各組樣本量相同且大於10時,對異方差不敏感,可以主要考慮正態性。如果各組樣本量不平衡且樣本量小,會對異方差很敏感,這時只要調到近似正態性(中度偏離)即可。
最後,還可以對秩進行方差分析。
對所有數據排序,次序稱為秩。
直接對秩進行方差分析,將結果與原方差分析進行比較,如果兩者接近,說明正態、等方差的假設是滿足的,應採用原方差分析的結果。如果差異較大,說明原數據對假設偏離較大,應採取秩方差分析的結果。