導航:首頁 > 使用方法 > 差別檢驗中常用的方法有

差別檢驗中常用的方法有

發布時間:2022-11-05 06:42:21

① 比較兩組數據顯著差異用什麼檢驗

交叉表卡方檢驗如果結果顯著,那麼有必要考究多個分組之間到底是哪些組間差異(率或構成比)有統計學意義,此時可採取分割法進行兩兩比較。在視頻課程中,我介紹的是自己手動進行篩選個案,將整個樣本拆分為多個兩兩比較的過程,比較麻煩且容易出錯。 今天分享SPSS的一個厲害參數選項——【交叉表→Z檢驗-比較列比例】。借用 生存分析公號 的案例數據,欲考察了解鄉鎮、縣城和城市中不同教師,對「你是否贊成教師聘任實行雙向選擇制度?」這一問題的看法是否存在差異

兩個相關樣本檢驗的方法主要有:Wilcoxon檢驗、Sign(符號)檢驗、McNemar檢驗和Marginal Homogeneity(邊際同質性)檢驗等。

Sign(符號)檢驗

配對資料的符號檢驗,通過分析兩個樣本各每對數據之差的正負符號的數目,來判斷兩個總體分布是否相同,而不考慮差值的實際大小。它對樣本是否來自正態總體沒有嚴格規定,它常用來檢驗兩平均值的一致性。

通常情況下,配對數據之差是正值時為「+」,是負值時為「-」。若所得的差值為「+」、「-」號的個數大致相等,則可認為兩組數據的分布沒有顯著差異,出現「+」或「-」的概率為0.5。若配對數據之差中「+」號和「-」號出現次數懸殊,則說明就可以在一定的顯著性水平α上,推斷這兩組數據的中值水平或總體分布是不相同的。

Wilcoxon符號秩檢驗 ( Wilcoxon signedrank test )

它是非參數統計中符號檢驗法的改進, 它不僅利用了觀察值和原假設中心位置的差的正負,還利用了差的值的大小的信息。雖然是 簡單的非參數方法,但卻體現了秩的基本思想。

將差值按大小順序排列且編自然序號(秩)後,若其正號的秩和(記為T+)與負號的秩

② 感官檢驗有哪些常用的方法

感官檢驗的方法食品感官檢驗的方法分為分析型感官檢驗和嗜好型感官檢驗兩種:分析型感官檢驗——把人的感覺作為測定儀器,測定食品的特性或差別的方法。比如:檢驗酒的雜味,判斷用多少人造肉代替香腸中的動物肉人們才能識別出它們之間的差別,評定各種食品的外觀、香味食感等特性都屬於分析型感官檢驗。 嗜好型感官檢驗——根據消費者的嗜好程度評定食品特性的方法。比如:飲料的甜度怎 樣算最好,電冰箱顏色怎樣最好等。弄清感官檢驗的目的,分清是利用人的感覺測定物質的特性(分析型)還是通過物質來測定人們嗜好度(嗜好型)是設計感官檢驗的出發點。例如,對二種冰淇淋,如果要研究二者的差別,就可以把冰淇淋溶解或用水稀釋,應在最容易檢查出其差別的條件下進行檢驗,但如果要研究哪種冰淇淋受消費者歡迎,通常必須在一般能吃的狀態下進行檢驗。2、常用試驗方法根據感官檢驗工作的目的和要求,常用的試驗方法有以下六種:(1)差別試驗(Difference Test)差別試驗用於分辨樣品之間的差別,其中包括 2個樣品或者是多個樣品之間的差別試驗。差別試驗是對樣品進行選擇性的比較,一般領先於其它試驗,在許多方面有廣泛的用途。 例如在貯藏試驗中,可以比較不同的貯藏時間對食品的味覺、口感、鮮度等質量指標的影響。 又如在外包裝試驗中,可以判斷哪種包裝形式更受歡迎,而成本高的包裝形式有時並不一定受消費者歡迎,都可以用差別試驗檢驗。差別試驗的試驗方法有:2點識別法、2點嗜好法、1:2點比較法、3點識別法、3點嗜好法等。試驗結果的分析常用查表法。 ①2點比較法是比較兩種試樣,以此來區別兩者或判斷其優劣的方法。這是最簡單,最基本的方法。可按試驗目的分為 2點識別法和 2點嗜好法。 2 點識別法是比較 X、Y 兩種試樣,根據人的感覺排列 X、Y的順序,即區別兩者的方法。由於 X和 Y之間的順序是客觀存在的。當人們的感覺判斷的順序和客觀存在的順序一致時,回答是正確的,否則回答是錯誤的,因此識別檢驗只需做單側檢驗。2點識別法一般用於判斷評審員的識別能力或者判斷 X、Y之間的差別是否達到能識別的程度等。本法具有準備和實施方便等優點,缺點是結果差錯的偶然可能性大。 2 點嗜好法是指比較 X、Y兩種試樣後指出自己喜歡哪一種的方法。在嗜好性檢驗中, 評審員指出 X、Y兩種試樣中的任何一個均可以,故必須進行雙側檢驗。本法主要用於市場調查和質量檢驗。②1:2比較法1:2比較法是指先供給試樣 X,讓評審員記住它的特性(這個試樣稱明試樣),然後同 時供給用暗號表示的試樣 X和 Y(因為評審員事先不知兩個試樣的內容和特性,故稱暗試樣), 讓評審員判斷兩個暗試樣中哪個是試樣 X的試驗。1:2 比較法一般用於出廠檢查驗收商品,或用於測定評審員的識別能力,該法比 2點比較法靈敏度高。③3點比較法有 2個試樣 X、Y,把兩個相同的試樣和一個不同的試樣按 XYY、XXY、XYX等方式組合 後供給評判員,讓評審員判斷其中一個不同的試樣的方法叫做 3點識別法。然後再比較一個 試樣和剩餘的兩個相同試樣,判斷喜歡哪一個的方法叫做 3點嗜好法。因此,3點比較法只經一次試驗,就能同時完成識別和嗜好兩個試驗。(2)排列試驗(Ranking Test) 排列試驗對某種食品的質量指標,按大小或強弱順序對樣品進行排列,並記上 1、2、3……數字。它具有簡單並且能夠評判 2個以上樣品的特點。其缺點是排列試驗只是一個初步的分辨試驗形式,它無法判斷樣品之間差別大小和程度,只是其試驗數據之間進行比較。試驗結果的分析常用查表法和方差分析法。(3)分級試驗(Scoring Test)分級試驗按照特定的分級尺度,對試樣進行評判,並給以適當的級值。分級試驗是以某個級數值來描述食品的屬性。在排列試驗中,兩個樣品之間必須存在先後順序,而在分級試驗中,兩個樣品可能屬於同一級數,也可能屬於不同級數,而且它們之間的級數差別可大可小。排列試驗和分級試驗各有特點和針對性。分級試驗的試驗方法主要有評分法、scheffe 一對比較法、模糊數學法等。試驗結果的 分析常用方差分析法。(4)閾值試驗(Threshold Test)閾值試驗是通過稀釋(樣品)確定感官分辨某一質指標的最小值。閾值試驗主要用於味覺的測定,測定值有:①刺激閾(RL)能夠分辨出感覺的最小刺激量叫做刺激閾。刺激閾分為:敏感閾、識別閾和極限閾。閾值大小取決於刺激的性質和評價員的敏感度,閾值大小也因測定方法的不同而發生變化。②分辨閾(DL)感覺上能夠分辨出刺激量的最小變化量稱分辨閾。,用+-△S來表示刺激量的增加(上) 或減少(下),上下分辨閾的絕對值的平均值稱平均分辨閾。③主觀等價值(DSE)對某些感官特性而言,有時兩個刺激產生相同的感覺效果,我們稱之為等價刺激。例如:10%的葡萄糖與 6.3%的蔗糖的刺繳等價。閾值試驗的試驗方法主要有極限法和定常法。(5)分析或描述試驗(Analysis or Description Test) 描述試驗是對樣品與標准樣品之間進行比較,給出較為准確的描述。描述試驗要求試驗人員對食品的質量指標用合理、清楚的文字作準確的描述。描述試驗有顏色和外表描述、風味描述、質構描述和定量描述。其主要用途有:新產品的研製與開發;鑒別產品間的差別;質量控制;為儀器檢驗提供感官數據;提供產品特性的永久記錄;監測產品在貯藏期間的變化等。因為感官感覺中任何一個器官的機能活動,不僅取決於直接刺激該器官所引起的響應,而且還受到其它感覺系統的影響,即感覺器官之間相互聯系、相互作用。所以,食品的感官感覺是不同強度的各種感覺的總和。並且各種不同刺激物的影響性質各不相同,因此,在食品感官檢驗中,即要控制一定條件來恆定一些因素的影響,又要考慮各種因素之間的互相關 聯作用。目前常用的分析和描述性檢驗方法主要有:簡單描述檢驗法及定量描述和感官剖面 檢驗法。①簡單描述檢驗法 它是評價員對構成產品特性的各個指標進行定性描述,盡量完整地描述出樣品品質的檢驗方法,描述檢驗按評價內容可分為風味描述和質地描述。按評價方式可分為自由式評價和界定式描述。自由式描述即評價員可用任意的詞彙,對樣品特性進行描述,但評價員一般需要對產品特性非常熟悉或受過專門訓練;界定式描述則在評價前由評價組織者提供指標檢驗表,評價員是在指標檢驗表的指導下進行評價的。該方法多用在食品加工中質量控制,產品貯藏期間質量變化,以及鑒評員培訓等情況。最後,在完成鑒評工作後,要由評價小組組織者統計結果,並將結果公布,由小組討論確定鑒評結果。②定量描述和感官剖面檢驗法它是評價員盡量完整地描述食品感官特性以及這些特性強度的檢驗方法。這種方法多用於產品質量控制、質量分析、判定產品差異性、新產品開發和產品品質改良等方面,還可以為儀器檢驗結果提供可對比的感官數據,使產品特性可以相對穩定地保存下來。這種方法依照檢驗方式的不同可分為一致方法和獨立方法二大類型。一致方法的含義是,在檢驗中所有的評價員(包括評價小組組長)以一個集體的一部分而工作,目的是獲得一個評價小組贊同的綜合印象,使描述產品風味特點達到一致、獲得同感的方法。在檢驗過 程中,如果不能一次達成共識,可藉助參比樣來進行,有時需要多次討論方可達到目的。獨立方法是由評價員先在小組內討論產品的風味,然後由每個評價員單獨工作,記錄對食品感覺的評價成績,最後用計算的平均值的方法,獲得評價結果。無論是一致方法還是獨立方法,在檢驗開始前,評價組織者和評價員應完成以下工作:①制定記錄樣品的特殊目錄;②確定 參比樣;③規定描述特性的詞彙;④建立描述和檢驗樣品的方法。 (6)消費者試驗(Consumer Test)消費者試驗是由顧客根據各人的愛好對食品進行評判。生產食品的最終目的是使食品被消費者接受和喜愛。消費者試驗的目的是確定廣大消費者對食品的態度。主要用於市場調查、向社會介紹新產品、進行預測等。由於消費者一般都沒有經過正規培訓,個人的愛好、偏食習慣、感官敏感性等情況都不一致,故要求試驗形式盡可能簡單、明了、易行。使得廣大消費者樂於接受,而且要保證

③ 差別檢驗中,具有相同的樣品呈送順序的檢驗方法有

差別檢驗中,具有相同的樣品呈送順序的檢驗方法有一起檢驗

④ 多種差別檢驗實驗:不同檢驗方法是否會影響實驗結果

應用最常見)和體外檢查法,體內檢查(法皮膚試驗,反復給病人皮下注射,人工分析結果或半自動儀器分析結果不會,濃度由低到高。可檢測40餘種過敏原、激發試驗。測試出過敏原後,目前過敏原檢測就2大類,3~24小時出結果,劑量由小到大;體外檢查法為目前較常用的方法。該治療方法是通過利用檢測到的使病人有過敏反應的過敏原,製成不同濃度,進行特異性免疫治療(即脫敏疫苗治療),利用患者血清檢測過敏原,逐漸誘導病人耐受該過敏原而不產生過敏反應,患者應盡量避免與過敏原接觸,同時接受正規的葯物治療

⑤ 推斷統計的差異檢驗方法是什麼

推斷統計包括總體參數估計和假設檢驗。差異檢驗是「假設檢驗」的一種,用於檢測科學實驗中實驗組與對照組之間是否有差異以及差異是否顯著的方法。

⑥ 食品感官檢驗常用方法

食品感官檢驗常用的方法有差別檢驗、標度和類別檢驗、分析和描述性檢驗等。差別檢驗主要是確定兩種產品之間是否存在感官差別。主要有5種類型,分別為成對比較檢驗、三點檢驗、三一三點檢驗、五中取二檢驗、「A」非「A」檢驗。這幾種類型在實際選擇時應根據實際檢驗情況加以選擇。標度和類別檢驗主要用於估計差別順序、差別大小和樣品應歸屬的類別和等級。標度和類別檢驗廣泛應用在估價產品一種或多種強度的強度、產品質量的評價。這種檢驗方法還可具體分為排序檢驗法、評估法、分等法、類別檢驗法、成對比較檢驗法等。

⑦ 對於R×C表資料的差異性檢驗,其相應的檢驗方法是什麼,如何進行

醫學論文中常用統計分析方法的合理選擇

目前,不少醫學論文中的統計分析存在較多的問題。有報道,經兩位專家審稿認為可以發表的稿件中,其統計學誤用率為90%-95%。為幫助廣大醫務工作者提高統計分析水平,本文將介紹醫學論文中常用統計分析方法的選擇原則及應用過程中的注意事項。 1.t 檢驗
t檢驗是英國統計學家W.S.Gosset 1908年根據t分布原理建立起來的一種假設檢驗方法,常用於計量資料中兩個小樣本均數的比較。理論上,t檢驗的應用條件是要求樣本來自正態分布的總體,兩樣本均數比較時,還要求兩總體方差相等。但在實際工作中,與上述條件略有偏離,只要其分布為單峰且近似正態分布,也可應用[2]。
常用的t檢驗有如下三類:①單個樣本t檢驗:用於推斷樣本均數代表的總體均數和已知總體均數有無顯著性差別。當樣本例數較少(n<60)且總體標准差未知時,選用t檢驗;反之當樣本例數較多或樣本例數較少、總體標准差已知時,則可選用u檢驗 [3]。②配對樣本t檢驗:適用於配對設計的兩樣本均數的比較,在選用時應注意兩樣本是否為配對設計資料。常用的配對設計資料主要有如下三種情況:兩種同質受試對象分別接受兩種不同的處理;同一受試對象或同一樣本的兩個部分,分別接受不同的處理;同一受試對象處理前後的結果比較。③兩獨立樣本t檢驗:又稱成組t檢驗,適用於完全隨機設計的兩樣本均數的比較。與配對t檢驗不同的是,在進行兩獨立樣本t檢驗之前,還必須對兩組資料進行方差齊性檢驗。若為小樣本且方差齊,則選用t檢驗;反之若方差不齊,則選用校正t檢驗(t』檢驗),或採用數據變換的方法(如取對數、開方、倒數等)使兩組資料具有方差齊性後再進行t檢驗,或採用非參數檢驗[4]。此外,當兩組樣本例數較多(n1、n2均>50)時,這時應用t檢驗的計算比較繁瑣,可選用u檢驗[5]。 2.方差分析
方差分析適用於兩組以上計量資料均數的比較,其應用條件是各組資料取自正態分布的總體且各組資料具有方差齊性。因此,在應用方差分析之前,同樣和成組t檢驗一樣需要對各組資料進行正態性檢驗、方差齊性檢驗。
常用的方差分析有如下幾類:①完全隨機設計的方差分析:主要用於推斷完全隨機設計的多個樣本均數所代表的總體均數之間有無顯著性差別。完全隨機設計是將觀察對象隨機分為兩組或多組,每組接受一種處理,形成兩個或多個樣本。②隨機區組設計的方差分析:
隨機區組設計首先是將全部受試對象按某種或某些特性分為若干區組,然後區組內的每個研究對象接受不同的處理,通過這種設計,既可以推斷處理因素又可以推斷區組因素是否對試驗效應產生作用。此外,由於這種設計還使每個區組內研究對象的水平盡可能地相近,減少了個體間差異對研究結果的影響,比成組設計更容易檢驗出處理因素間的差別。③析因設計的方差分析:將兩個或兩個以上處理因素的各種濃度水平進行排列組合、交叉分組的試驗設計。它不僅可以檢驗每個因素各水平之間是否有差異,還可以檢驗各因素之間是否有交互作用,同時還可以找到處理因素的各種濃度水平之間的最佳組合。此外,還有正交設計、拉丁方設計等多種方差分析法,實驗者在應用時可以參考相關的統計學著作。
目前,某些醫學論文中有這樣的情況,就是用t 檢驗代替方差分析對實驗數據進行統計學處理,這是不可取的。t 檢驗只適用於推斷兩個小樣本均數之間有無顯著性差別,而採用t 檢驗對多組均數進行兩兩比較,會增加犯I 型錯誤的概率,即可能把本來無差別的兩個總體均數判為有差別,使結論的可信度降低[6]。對多個樣本均數進行比較時,正確的方法是先進行方差分析,若檢驗統計量有顯著性意義時,再進行多個樣本均數的兩兩(多重)比較。
3.卡方檢驗(χ2檢驗)
χ2檢驗是一種用途比較廣泛的假設檢驗方法,但是在醫學論文中常用於分類計數資料的假設檢驗,即用於兩個樣本率、多個樣本率、樣本內部構成情況的比較,樣本率與總體率的比較,某現象的實際分布與其理論分布的比較。但是當樣本滿足正態近似條件時,如樣本例數n與樣本率p滿足條件np與n(1— p)均大於5,則可以計算假設檢驗統計量u值來進行判斷。
常用的χ2
檢驗分為如下幾類:①2×2表χ2
檢驗:適用於兩個樣本率或構成比的比較,在應用時,當整個試驗的樣本例數n≥40且某個理論頻數1≤T<5時,需對χ2
值進行連續性校正。因為T值太小,會導致χ2
值增大,易出現假陽性結論。此外,若樣本例數n<40,或有某個T值<1,此時即使採用校正公式計算的χ2
值也有偏差,需要用2×2表χ2
檢驗的確切概率檢驗法(Fisher確切檢驗法)。②配對資料χ2檢驗:適用於配對設計的兩個樣本率或構成比的比較,即通過單一樣本的數據推斷兩種處理結果有無顯著性差別。在應用時,如果甲處理結果為陽性而乙處理結果為陰性的樣本例數n1與甲處理結果為陰性而乙處理結果為陽性的樣本例數n2之和<40,需要對計算的χ2
值進行校正。③R×C表χ2
檢驗:適用於多個樣本率或構成比的比較。在R×C表χ2檢驗中,若檢驗統計量有顯著性意義時,還需要對多個樣本率或構成比進行兩兩比較,即分割R×C表,使之成為非獨立的四格表,並對每兩個率之間有無顯著性差別作出結論。
2×2表資料在應用時可分為如下幾種類型:橫斷面研究設計的2×2表資料、隊列研究設計的2×2表資料、病例-對照研究設計的2×2表資料、配對研究設計的2×2表資料。研究者應注意不同類型的2×2表資料的統計分析方法略有差別,比如在分析隊列研究設計的2×2表資料時,如果用χ2公式計算得到P<0.05,研究者則應再計算相對危險度(RR)並檢驗總體RR與1之間的差異是否具有統計學意義。
此外,在進行R×C表χ2檢驗時,還有如下兩個主要的注意事項:首先,T值最好不要<5,若有1/5的T值<5,χ2檢驗結論是不可靠的,解決的辦法有三種:增大樣本量;刪去T值太小的行和列;將T值太小的行或列與性質相近的鄰行或鄰列的實際頻數合並。
其次,不同類型的R×C表資料選擇的統計分析方法是不一樣。①雙向無序的R×C表資料:可以選用一般的χ2公式計算。②單向有序的R×C表資料:如果是原因變數為有序變數的單向有序R×C表資料,可以將其視為雙向無序的R×C表資料而選用一般的χ2檢驗公式計算,但如果是結果變數為有序變數的單向有序R×C表資料,選用的統計分析方法有秩和檢驗、Radit分析和有序變數的logistic回歸分析等。③雙向有序且屬性不同的R×C表資料:對於這類資料採用的統計分析方法不能一概而論,應根據研究者的分析目而合理選擇。如果研究者只關心原因變數與結果變數之間的差異是否具有統計學意義時,此時,原因變數的有序性就顯得無關緊要了,可將其視為結果變數為有序變數的單向有序R×C表資料進行分析。如果研究者希望考察原因變數與結果變數之間是否存在線性相關關系,此時需要選用處理定性資料的相關分析方法如Spearman秩相關分析方法等。如果兩個有序變數之間的相關關系具有統計學意義,研究者希望進一步了解這兩個有序變數之間的線性關系,此時宜選用線性趨勢檢驗。如果研究者希望考察列聯表中各行上的頻數分布是否相同,此時宜選用一般的χ
因此,對於適用參數檢驗的資料,最好還是用參數檢驗。
秩和檢驗是最常用的非參數檢驗,它包括如下幾類:①配對資料的符號秩和檢驗
(Wilcoxon配對法):是配對設計的非參數檢驗。當n≤25時,可通過秩和檢驗對實驗資料進行分析;當n>25時,樣本例數超出T界值表的范圍,可按近似正態分布用u檢驗對實驗資料進行分析。②兩樣本比較的秩和檢驗(Wilcoxon Mann-Whitney檢驗):適用於比較兩樣本分別代表的總體分布位置有無差異。如果樣本甲的例數為n1,樣本乙的例數為n2,且n1<n2;當n1≤10、n2—n1≤10時,可通過兩樣本比較的秩和檢驗對實驗資料進行分析;當n1、n2超出T界值表的范圍時,同樣可按近似正態分布用u檢驗對實驗資料進行分析。③多個樣本比較的秩和檢驗(Wilcoxon Kruskal-Wallis檢驗):適用於比較各樣本分別代表的總體的位置有無差別,它相當於單因素方差分析的非參數檢驗,計算方法主要有直接法和頻數表法等。此外,在進行上述3類秩和檢驗(前兩類秩和檢驗實際上已經被u檢驗替代)時,如果相同秩次較多,則需要對計算的檢驗統計量進行校正。
公式計算。④雙向有序且屬性相同的R×C表資料:這類資料實際上就是配對設計2×2表資料的延伸,在分析這類資料時,實驗者的目的主要是研究兩種處理方法檢測結果之間是否具有一致性,因此常用的統計分析方法為一致性檢驗或Kappa檢驗。
4. 非參數檢驗
非參數檢驗可不考慮總體的參數、分布而對總體的分布或分布位置進行檢驗。它通常適用於下述資料[2]:①總體分布為偏態或分布形式未知的計量資料(尤其樣本例數n<30時);②等級資料;③個別數據偏大或數據的某一端無確定的數值;④各組離散程度相差懸殊,即各總體方差不齊。該方法具有適應性強等優點,但同時也損失了部分信息,使得檢驗效率降低。即當資料服從正態分布時,選用非參數檢驗法代替參數檢驗法會增大犯Ⅱ類錯誤的概率。

⑧ 組間差異檢驗,終於有人講清楚了!

什麼是組間差異檢驗?就是組間的差異分析以及顯著性檢驗,應用統計學上的 假設檢驗 方法,檢驗組間是否有差異及其差異程度。坦率地講,所有的差異檢驗都基於一個假設:組間沒有差異,變數之間沒有關系(即原假設, )。上海交大王成老師也說方差分析其實研究的就是不同水平下是否有差異化的假設檢驗問題。而假設檢驗就是先對總體參數提出某種假設,然後利用樣本信息判斷假設是否成立的過程。

所以,本著負責的態度,在本文的開始我們有必要回顧一下《概率論與數理統計》中關於假設檢驗的基本概念。

其中 參數 這個概念最值得我們好好體會,因為今天的主角 組間差異檢驗 ,在這個水平上可以分為兩類:參數檢驗和非參數檢驗。那麼什麼叫參數檢驗和非參數檢驗,它們之間的區別是什麼呢。要理解前面的問題,首先需要明白統計推斷的概念。

統計推斷是研究如何利用樣本數據來推斷總體特徵的統計學方法,包括參數估計和假設檢驗兩大類。總體的參數一般是未知的,通常可以用樣本統計量來對總體的參數進行估計,例如可以用樣本均值對總體均值進行點估計,利用樣本均值的分布對總體均值進行區間估計,這些都稱為參數估計。

參數檢驗和非參數檢驗的區別:

那麼什麼時候用參數檢驗,什麼時候用非參數檢驗呢?非參數檢驗一般不直接用樣本觀察值作分析,統計量的計算基於原始數據在整個樣本中的秩次,丟棄了觀察值的具體數值,因此凡適合參數檢驗的資料,應首選參數檢驗。但是不清楚是否合適參數檢驗的資料,則應採用非參數檢驗。

此處也許大家期待作者帶我們溫習一下假設檢驗的4 個步驟(提出假設;構造檢驗統計量;根據顯著水平,確定臨界值和拒絕域;做出檢驗決策),但是帶有幾分傲氣的作者絕情地不為我們沒有學好的課程補刀,補課的事情讓我們自己去做,他轉而講自己認為重要的知識點:抽樣分布。

知道我們的研究對象整體處於什麼狀態,是一件非常重要的事情。三大抽樣分布( -分布、 分布、 -分布)和正態分布共同構成了現代數理統計學的基礎,其中,正態分布和 -分布是關於均值的分布; 分布、 -分布是關於方差的分布。很多同學做統計做了很多年,卻不知道為什麼幾乎每個方差分析都有 值。可見,統計學拼到最後拼的都是 基礎

離開分布,假設檢驗無從談起;離開假設檢驗,差異分析毫無根基。同樣地,出於人道主義,我們來重溫一下抽樣分布。

設 X 1 ,X 2 ,......X n 相互獨立, 都服從標准正態分布N(0,1), 則稱隨機變數χ 2 =X 1 2 +X 2 2 +......+X n 2 所服從的分布為自由度為 n 的 分布

設 服從標准正態分布N(0,1), 服從自由度為n的 分布,且 、 相互獨立,則稱變數 所服從的分布為自由度為n的 -分布

設 服從自由度為 的 分布, 服從自由度為 的 分布,且 、 相互獨立,則稱變數 所服從的分布為 分布,其中第一自由度為 ,第二自由度為 。一般滴,這里F就是均方之比。

不管是參數檢驗還是非參數檢驗,都要基於特定的分布來做假設檢驗。當總體分布已知時,例如總體服從正態分布,我們可以根據給定的顯著性水平(通常為0.01 或0.05)查表獲得臨界值。當總體分布未知時,可以先用Permutation test 構造經驗分布,再根據顯著性水平獲得臨界值。

傳統的統計量檢驗的方法是在檢驗之前確定顯著性水平 ,也就意味著事先確定了臨界值和拒絕域。這樣,不論檢驗統計量的值是大還是小,只要它的值落入拒絕域就拒絕原假設,否則就不拒絕原假設。這種給定顯著性水平的方法,無法給出觀測數據與原假設之間不一致程度的精確度量。要測量出樣本觀測數據與原假設中假設值的偏離程度,則需要計算pvalue值。pvalue 值,也稱為觀測到的顯著性水平,它表示為如果原假設 正確時得到實際觀測樣本結果的概率。pvalue 值越小,說明實際觀測到的數據與 之間的不一致的程度就越大,檢驗的結果就越顯著。

變數較多,判斷組間差異時需要多重檢驗的情況在宏基因組擴增子差異分析中十分常見。這種情況下,基於單次比較的檢驗標准將變得過於寬松,使得陽性結果中的錯誤率(FDR 值FalseDiscovery Rate)非常大(已經大到令人不可忍受的地步)。怎麼辦呢?最好的辦法就提高判斷的標准(p value),單次判斷的犯錯概率就會下降,總體犯錯的概率也將下降。在多重檢驗中提高判斷標準的方法,我們就稱之為 多重檢驗校正 。從1979 年以來,統計學家提出了多種多重檢驗校正的方法。相應地,對p值校正之後的叫法也不一樣,比如,FDR、Q value、Adjusted p-value,這個大家知道在多重檢驗時需要校正就行了,具體的用法作者有時間再教大家(這個作者真是皮啊~~)。

關於宏基因組或擴增子組間差異檢驗的理論知識就到這了,作者認為知道以上知識點是必要的,也告訴我們,今天我們討論的是統計推斷。換句話說,找差異,我們是專業的。

人民為了找差異,這才學會做統計。為了說明組間的數據差異很大,人民開發了許多沿用至今的圖畫,下面我們就一起來揭開這一幅幅有差異的畫面。

在數據科學家的工具箱里,這是一款經久不衰、常用常新的瑞士軍刀。幾乎只要想到差異分析,就會想到箱線圖。也開發出類箱線圖的工具比如小提琴圖(小提琴圖Violin plot)

一般有進化樹和層次聚類樹,如果你想表達對象之間的距離差異,最直觀的的也許就是樹狀圖了。為了用圖表示親緣關系,把分類單位擺在圖上樹枝頂部,根據分枝可以表示其相互關系,具有二次元和三次元。在數量分類學上用於表型分類的樹狀圖,稱為表型樹狀圖(phenogram),摻入系統的推論的稱為系統樹狀圖(cladogram)以資區別。

貼心的作者小朋友把實現這些圖形的常見R包列給大家,安裝後就能用啦

這里說的基於物種言下之意是通過統計分析,可以有針對性的找出分組間豐度變化差異顯著的物種,並得到差異物種在不同分組間的富集情況,同時,可以比較組內差異和組間差異的大小,判斷不同分組間的群落結構差異是否具有顯著意義。也就是說可以找出區別組間的一個biomarker。

這類檢驗一般只輸出p值,它的目的很簡單,就是檢驗比較組之間的相似性距離是否有差異。常用的分析方法有卡方檢驗、Student t檢驗、Wilcoxon秩和檢驗等等。

如果只有兩個樣本比較,適合用卡方檢驗 ,不過說實在的,檢驗出來的結果沒什麼可靠性,因為現階段16s研究不做重復實在「難以服眾」了。先不說價格便宜,做重復壓根沒有難度,就是從生物學、統計學角度考慮,也需要做重復。

如果是兩組樣本(至少3重復),可以試一下Student t,Welch『st以及Wilcoxon秩和檢驗 。Student t檢驗需要樣本符合正態分布,而且方差對齊。當組間樣本數不同,方差也不對齊的時候,Welch』s t檢驗是很好的選擇。

Wilcoxon秩和檢驗又叫Mann-Whitney U 檢驗,是基於變數排名的一種統計方法,不需要樣本符合正態分布,也不需要樣本方差對齊,是更為廣泛的檢驗方法,但同時也由於檢驗太寬松,容易帶來很多假陽性。

如果是多組樣本比較,可以選擇one way ANOVA、TURKEY以及Kruskal-Wallis H檢驗等方法 。one way ANOVA和TURKEY其實都是基於方差分析,只不過後者帶有後驗,可以知道兩個分組對整體差異的貢獻度。

Kruskal-Wallis H檢驗本質也是一種秩和檢驗,與前兩者的區別在於,它不需要樣本數和方差的對齊,應用更為廣泛。Kruskal-Wallis檢驗又被稱之為單因素非參數方差分析。

毫不客氣地講,一般秩和檢驗或置換檢驗屬於非參數檢驗。在這類差異檢驗中,有兩種集成方法特別值得我們注意:LEfSe 、metastats。

得到結果展示如下,差異體現在柱形圖和樹狀圖上。LDA值分布柱狀圖中展示了LDA Score大於設定值(默認設置為4)的物種,即組間具有統計學差異的Biomarker。展示了不同組中豐度差異顯著的物種,柱狀圖的長度代表差異物種的影響大小(即為 LDA Score)。

在進化分支圖中,由內至外輻射的圓圈代表了由門至屬(或種)的分類級別。在不同分類級別上的每一個小圓圈代表該水平下的一個分類,小圓圈直徑大小與相對豐度大小呈正比。著色原則:無顯著差異的物種統一著色為黃色,差異物種Biomarker跟隨組進行著色,紅色節點表示在紅色組別中起到重要作用的微生物類群,綠色節點表示在綠色組別中起到重要作用的微生物類群,若圖中某一組缺失,則表明此組中並無差異顯著的物種,故此組缺失。圖中英文字母表示的物種名稱在右側圖例中進行展示。

metastats結果給出差異物種的p值和q值(表中 的數據是假的!)

所謂基於距離也就是檢驗的是群落差異而不是某個物種。上面所提及的檢驗方法,其實都只能告訴大家,這些分組是否有顯著差異(可以簡單理解為有無)。那如果想同時知道這些差異的程度(可以簡單理解為多少)呢,那需要Anosim,Adonis以及MRPP等檢驗方法。這些方法不但可以輸出檢驗顯著性結果(p值),還有程度結果(R值),R值可以用來判斷分組貢獻度大小。Anosim、Adonis這些可用於多元統計檢驗的模型就非常適合了。要值得注意的是,Anosim本質是基於排名的演算法,其實與NMDS的配合效果最好。如果是PCoA分析,建議配合使用Adonis檢驗結果。

Anosim(Analysis of similarities)是一種非參數檢驗方法。它首先通過變數計算樣本間關系(或者說相似性),然後計算關系排名,最後通過排名進行置換檢驗判斷組間差異是否顯著不同於組內差異。這個檢驗有兩個重要的數值,一個是p值,可以判斷這種組間與組內的比較是否顯著;一個是R值,可以得出組間與組內比較的差異程度。Anosim用來檢驗組間的差異是否顯著大於組內差異,從而判斷分組是否有意義,Anosim分析使用R vegan包anosim函數,一般基於Bray-Curtis距離值的秩次進行組間差異顯著行檢驗,詳細計算過程可查看 Anosim 。

該方法主要有兩個數值結果:一個是R,用於不同組間否存在差異;一個是P,用於說明是否存在顯著差異。以下分別對兩個數值進行說明:
R值的計算公式如下:

rB:組間差異性秩的平均值(mean rank of between group dissimilarities)
rW:組內差異性秩的平均值(mean rank of within group dissimilarities)
n:總樣本個數(the number of samples)

R的范圍為[-1,1]
R>0說明組間差異大於組內差異,R<0組間差異小於組內差異。
R只是組間是否有差異的數值表示,並不提供顯著性說明。

P值則說明不同組間差異是否顯著,該P值通過置換檢驗(Permutation Test)獲得。
置換檢驗大致原理:(假設原始分組為實驗組和對照組)

1、對所有樣本進行隨機分組,即實驗組和對照組。
2、計算當前分組時的R值,即為Ri。
3、重復當前操作N次,對所有Ri及原始R從大到小排序,R所處的位置除以N即為置換檢驗P值。

ADONIS又稱置換多因素方差分析(permutational MANOVA)或非參數多因素方差分析(nonparametric MANOVA),是一種基於Bray-Curtis距離的非參數多元方差分析方法。它與Anosim的用途其實差不多,也能夠給出不同分組因素對樣品差異的解釋度(R值)與分組顯著性(P值)。不同點是應用的檢驗模型不同,ADONIS本質是基於F統計量的方差分析,所以很多細節與上述方差分析類似。該方法可分析不同分組因素對樣本差異的解釋度,並使用置換檢驗對分組的統計學意義進行顯著性分析。ADONIS分析使用R vegan包adonis函數進行分析,詳細計算過程可 adonis

MRPP分析與Anosim類似,但是MRPP是基於Bray-Curtis的參數檢驗,用於分析組間微生物群落結構的差異是否顯著,通常配合PCA、PCoA、NMDS等降維圖使用,MRPP分析使用R vegan包mrpp函數,詳細計算過程可查看 MRPP

分子方差分析法 (AMOVA)與ANOVA類似,是基於加權或非加權Unifrac距離矩陣,檢驗不同組間差異顯著性的非參數分析方法。一般基於Unifrac距離,使用mothur軟體amova函數進行組間差異分析,詳細計算過程可查看 Amova

Mantel test,Mantel test 是對兩個矩陣相關關系的檢驗,顧名思義,是一種檢驗。既然是檢驗就得有原假設,它的原假設是兩個矩陣見沒有相關關系。檢驗過程如下:兩個矩陣都對應展開,變數兩列,計算相關系數(理論上什麼相關系數都可以計算,但常用pearson相關系數),然後其中一列或兩列同時置換,再計算一個值,permutation 成千上萬次,看實際的r值在所得r值分布中的位置,如果跟隨機置換得到的結果站隊較近,則不大相關,如果遠遠比隨機由此得到顯著性。詳細計算過程可查看 Mantel test

作者實在太懶,堅持別人已經說過的話不願再說,只要抄過來就好了,在文章的最後他把趙小胖的一段話原版搬了過來:

無論你從事何種領域的科學研究還是統計調查,顯著性檢驗作為判斷兩個乃至多個數據集之間是否存在差異的方法被廣泛應用於各個科研領域。筆者作為科研界一名新人也曾經在顯著性檢驗方面吃過許多苦頭。後來醉心於統計理論半載有餘才摸到顯著性檢驗的皮毛,也為顯著性檢驗理論之精妙,品種之繁多,邏輯之嚴謹所折服。在此,特寫下這篇博文,以供那些仍然掙扎在顯著性檢驗泥潭的非統計專業的科研界同僚們參考。由於筆者本人也並非統計專業畢業,所持觀點粗陋淺鄙,貽笑大方之處還望諸位業界前輩,領域翹楚不吝賜教。小可在此謝過諸位看官了。

參考:

⑨ 11、固定參照模型的二-三點檢驗時注意事項有哪些

注意編碼樣品。
三點檢驗法是差別檢驗當中最常用的一種方法,具體是:在檢驗中,同時提供3個編碼樣品,其中兩個是相同的,另外一個樣品與其他兩個樣品不同。

⑩ 有實驗組控制組的測試結果,欲檢驗其是否存在顯著差異,應選用哪些可用的方法

當試驗數據出現兩種或者多種不同的結果時,應該採用統計學的方法,通過顯著性檢驗來判斷試驗數據之間是否存在顯著性差異。
顯著性檢驗的方法通常有t檢驗法和F檢驗法:
t檢驗用來檢測兩組數據的准確度,確定是否存在系統誤差
F檢驗又叫方差齊性檢驗,用來檢測兩組或多組數據的精密度,確定是否存在偶然誤差
計算公式和查表之類的就不寫了,太復雜,而且你手上應該都有
針對你的數據,如果只是「需要看一下兩組差別是不是很大」,只用F檢驗即可
如果你需要確定數據是否存在系統誤差,或是否與假設結論是否相符時,則需要用到t檢驗
提醒一句,若要進行t檢驗,首先得進行F檢驗,用以判斷兩組數據的方差齊性
若兩組數據方差相等,則用t檢驗;若方差不等,則用變種的t'檢驗
總之,不論怎樣,都要用到F檢驗

閱讀全文

與差別檢驗中常用的方法有相關的資料

熱點內容
益節美國氨糖食用方法 瀏覽:559
飛利浦溫奶器使用方法 瀏覽:923
FDMS顆粒物測量方法 瀏覽:775
2015新君威後備箱進水解決方法 瀏覽:929
北京標桿企業調研方法有哪些 瀏覽:113
鉛筆生活技巧和方法 瀏覽:537
煙氣控制方法有哪些 瀏覽:693
中葯分析驗證方法 瀏覽:917
解決代溝的有效方法 瀏覽:693
王伯彤比特訓練方法 瀏覽:87
腦袋上毛囊炎最好治療方法 瀏覽:231
炒股的股利計算方法 瀏覽:751
傳統生態學研究方法 瀏覽:443
認土鴨子的方法視頻 瀏覽:201
栽種豆角更簡便的方法 瀏覽:64
六字訣快速練習方法 瀏覽:857
獲得金屬單質常用的方法 瀏覽:318
用什麼方法止癢好 瀏覽:635
瘦肚子後背運動方法視頻 瀏覽:188
冬天怎麼除甲醛最快最有效的方法 瀏覽:480