① 比较两组数据显着差异用什么检验
交叉表卡方检验如果结果显着,那么有必要考究多个分组之间到底是哪些组间差异(率或构成比)有统计学意义,此时可采取分割法进行两两比较。在视频课程中,我介绍的是自己手动进行筛选个案,将整个样本拆分为多个两两比较的过程,比较麻烦且容易出错。 今天分享SPSS的一个厉害参数选项——【交叉表→Z检验-比较列比例】。借用 生存分析公号 的案例数据,欲考察了解乡镇、县城和城市中不同教师,对“你是否赞成教师聘任实行双向选择制度?”这一问题的看法是否存在差异
两个相关样本检验的方法主要有:Wilcoxon检验、Sign(符号)检验、McNemar检验和Marginal Homogeneity(边际同质性)检验等。
Sign(符号)检验
配对资料的符号检验,通过分析两个样本各每对数据之差的正负符号的数目,来判断两个总体分布是否相同,而不考虑差值的实际大小。它对样本是否来自正态总体没有严格规定,它常用来检验两平均值的一致性。
通常情况下,配对数据之差是正值时为“+”,是负值时为“-”。若所得的差值为“+”、“-”号的个数大致相等,则可认为两组数据的分布没有显着差异,出现“+”或“-”的概率为0.5。若配对数据之差中“+”号和“-”号出现次数悬殊,则说明就可以在一定的显着性水平α上,推断这两组数据的中值水平或总体分布是不相同的。
Wilcoxon符号秩检验 ( Wilcoxon signedrank test )
它是非参数统计中符号检验法的改进, 它不仅利用了观察值和原假设中心位置的差的正负,还利用了差的值的大小的信息。虽然是 简单的非参数方法,但却体现了秩的基本思想。
将差值按大小顺序排列且编自然序号(秩)后,若其正号的秩和(记为T+)与负号的秩
② 感官检验有哪些常用的方法
感官检验的方法食品感官检验的方法分为分析型感官检验和嗜好型感官检验两种:分析型感官检验——把人的感觉作为测定仪器,测定食品的特性或差别的方法。比如:检验酒的杂味,判断用多少人造肉代替香肠中的动物肉人们才能识别出它们之间的差别,评定各种食品的外观、香味食感等特性都属于分析型感官检验。 嗜好型感官检验——根据消费者的嗜好程度评定食品特性的方法。比如:饮料的甜度怎 样算最好,电冰箱颜色怎样最好等。弄清感官检验的目的,分清是利用人的感觉测定物质的特性(分析型)还是通过物质来测定人们嗜好度(嗜好型)是设计感官检验的出发点。例如,对二种冰淇淋,如果要研究二者的差别,就可以把冰淇淋溶解或用水稀释,应在最容易检查出其差别的条件下进行检验,但如果要研究哪种冰淇淋受消费者欢迎,通常必须在一般能吃的状态下进行检验。2、常用试验方法根据感官检验工作的目的和要求,常用的试验方法有以下六种:(1)差别试验(Difference Test)差别试验用于分辨样品之间的差别,其中包括 2个样品或者是多个样品之间的差别试验。差别试验是对样品进行选择性的比较,一般领先于其它试验,在许多方面有广泛的用途。 例如在贮藏试验中,可以比较不同的贮藏时间对食品的味觉、口感、鲜度等质量指标的影响。 又如在外包装试验中,可以判断哪种包装形式更受欢迎,而成本高的包装形式有时并不一定受消费者欢迎,都可以用差别试验检验。差别试验的试验方法有:2点识别法、2点嗜好法、1:2点比较法、3点识别法、3点嗜好法等。试验结果的分析常用查表法。 ①2点比较法是比较两种试样,以此来区别两者或判断其优劣的方法。这是最简单,最基本的方法。可按试验目的分为 2点识别法和 2点嗜好法。 2 点识别法是比较 X、Y 两种试样,根据人的感觉排列 X、Y的顺序,即区别两者的方法。由于 X和 Y之间的顺序是客观存在的。当人们的感觉判断的顺序和客观存在的顺序一致时,回答是正确的,否则回答是错误的,因此识别检验只需做单侧检验。2点识别法一般用于判断评审员的识别能力或者判断 X、Y之间的差别是否达到能识别的程度等。本法具有准备和实施方便等优点,缺点是结果差错的偶然可能性大。 2 点嗜好法是指比较 X、Y两种试样后指出自己喜欢哪一种的方法。在嗜好性检验中, 评审员指出 X、Y两种试样中的任何一个均可以,故必须进行双侧检验。本法主要用于市场调查和质量检验。②1:2比较法1:2比较法是指先供给试样 X,让评审员记住它的特性(这个试样称明试样),然后同 时供给用暗号表示的试样 X和 Y(因为评审员事先不知两个试样的内容和特性,故称暗试样), 让评审员判断两个暗试样中哪个是试样 X的试验。1:2 比较法一般用于出厂检查验收商品,或用于测定评审员的识别能力,该法比 2点比较法灵敏度高。③3点比较法有 2个试样 X、Y,把两个相同的试样和一个不同的试样按 XYY、XXY、XYX等方式组合 后供给评判员,让评审员判断其中一个不同的试样的方法叫做 3点识别法。然后再比较一个 试样和剩余的两个相同试样,判断喜欢哪一个的方法叫做 3点嗜好法。因此,3点比较法只经一次试验,就能同时完成识别和嗜好两个试验。(2)排列试验(Ranking Test) 排列试验对某种食品的质量指标,按大小或强弱顺序对样品进行排列,并记上 1、2、3……数字。它具有简单并且能够评判 2个以上样品的特点。其缺点是排列试验只是一个初步的分辨试验形式,它无法判断样品之间差别大小和程度,只是其试验数据之间进行比较。试验结果的分析常用查表法和方差分析法。(3)分级试验(Scoring Test)分级试验按照特定的分级尺度,对试样进行评判,并给以适当的级值。分级试验是以某个级数值来描述食品的属性。在排列试验中,两个样品之间必须存在先后顺序,而在分级试验中,两个样品可能属于同一级数,也可能属于不同级数,而且它们之间的级数差别可大可小。排列试验和分级试验各有特点和针对性。分级试验的试验方法主要有评分法、scheffe 一对比较法、模糊数学法等。试验结果的 分析常用方差分析法。(4)阈值试验(Threshold Test)阈值试验是通过稀释(样品)确定感官分辨某一质指标的最小值。阈值试验主要用于味觉的测定,测定值有:①刺激阈(RL)能够分辨出感觉的最小刺激量叫做刺激阈。刺激阈分为:敏感阈、识别阈和极限阈。阈值大小取决于刺激的性质和评价员的敏感度,阈值大小也因测定方法的不同而发生变化。②分辨阈(DL)感觉上能够分辨出刺激量的最小变化量称分辨阈。,用+-△S来表示刺激量的增加(上) 或减少(下),上下分辨阈的绝对值的平均值称平均分辨阈。③主观等价值(DSE)对某些感官特性而言,有时两个刺激产生相同的感觉效果,我们称之为等价刺激。例如:10%的葡萄糖与 6.3%的蔗糖的刺缴等价。阈值试验的试验方法主要有极限法和定常法。(5)分析或描述试验(Analysis or Description Test) 描述试验是对样品与标准样品之间进行比较,给出较为准确的描述。描述试验要求试验人员对食品的质量指标用合理、清楚的文字作准确的描述。描述试验有颜色和外表描述、风味描述、质构描述和定量描述。其主要用途有:新产品的研制与开发;鉴别产品间的差别;质量控制;为仪器检验提供感官数据;提供产品特性的永久记录;监测产品在贮藏期间的变化等。因为感官感觉中任何一个器官的机能活动,不仅取决于直接刺激该器官所引起的响应,而且还受到其它感觉系统的影响,即感觉器官之间相互联系、相互作用。所以,食品的感官感觉是不同强度的各种感觉的总和。并且各种不同刺激物的影响性质各不相同,因此,在食品感官检验中,即要控制一定条件来恒定一些因素的影响,又要考虑各种因素之间的互相关 联作用。目前常用的分析和描述性检验方法主要有:简单描述检验法及定量描述和感官剖面 检验法。①简单描述检验法 它是评价员对构成产品特性的各个指标进行定性描述,尽量完整地描述出样品品质的检验方法,描述检验按评价内容可分为风味描述和质地描述。按评价方式可分为自由式评价和界定式描述。自由式描述即评价员可用任意的词汇,对样品特性进行描述,但评价员一般需要对产品特性非常熟悉或受过专门训练;界定式描述则在评价前由评价组织者提供指标检验表,评价员是在指标检验表的指导下进行评价的。该方法多用在食品加工中质量控制,产品贮藏期间质量变化,以及鉴评员培训等情况。最后,在完成鉴评工作后,要由评价小组组织者统计结果,并将结果公布,由小组讨论确定鉴评结果。②定量描述和感官剖面检验法它是评价员尽量完整地描述食品感官特性以及这些特性强度的检验方法。这种方法多用于产品质量控制、质量分析、判定产品差异性、新产品开发和产品品质改良等方面,还可以为仪器检验结果提供可对比的感官数据,使产品特性可以相对稳定地保存下来。这种方法依照检验方式的不同可分为一致方法和独立方法二大类型。一致方法的含义是,在检验中所有的评价员(包括评价小组组长)以一个集体的一部分而工作,目的是获得一个评价小组赞同的综合印象,使描述产品风味特点达到一致、获得同感的方法。在检验过 程中,如果不能一次达成共识,可借助参比样来进行,有时需要多次讨论方可达到目的。独立方法是由评价员先在小组内讨论产品的风味,然后由每个评价员单独工作,记录对食品感觉的评价成绩,最后用计算的平均值的方法,获得评价结果。无论是一致方法还是独立方法,在检验开始前,评价组织者和评价员应完成以下工作:①制定记录样品的特殊目录;②确定 参比样;③规定描述特性的词汇;④建立描述和检验样品的方法。 (6)消费者试验(Consumer Test)消费者试验是由顾客根据各人的爱好对食品进行评判。生产食品的最终目的是使食品被消费者接受和喜爱。消费者试验的目的是确定广大消费者对食品的态度。主要用于市场调查、向社会介绍新产品、进行预测等。由于消费者一般都没有经过正规培训,个人的爱好、偏食习惯、感官敏感性等情况都不一致,故要求试验形式尽可能简单、明了、易行。使得广大消费者乐于接受,而且要保证
③ 差别检验中,具有相同的样品呈送顺序的检验方法有
差别检验中,具有相同的样品呈送顺序的检验方法有一起检验
④ 多种差别检验实验:不同检验方法是否会影响实验结果
应用最常见)和体外检查法,体内检查(法皮肤试验,反复给病人皮下注射,人工分析结果或半自动仪器分析结果不会,浓度由低到高。可检测40余种过敏原、激发试验。测试出过敏原后,目前过敏原检测就2大类,3~24小时出结果,剂量由小到大;体外检查法为目前较常用的方法。该治疗方法是通过利用检测到的使病人有过敏反应的过敏原,制成不同浓度,进行特异性免疫治疗(即脱敏疫苗治疗),利用患者血清检测过敏原,逐渐诱导病人耐受该过敏原而不产生过敏反应,患者应尽量避免与过敏原接触,同时接受正规的药物治疗
⑤ 推断统计的差异检验方法是什么
推断统计包括总体参数估计和假设检验。差异检验是“假设检验”的一种,用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显着的方法。
⑥ 食品感官检验常用方法
食品感官检验常用的方法有差别检验、标度和类别检验、分析和描述性检验等。差别检验主要是确定两种产品之间是否存在感官差别。主要有5种类型,分别为成对比较检验、三点检验、三一三点检验、五中取二检验、“A”非“A”检验。这几种类型在实际选择时应根据实际检验情况加以选择。标度和类别检验主要用于估计差别顺序、差别大小和样品应归属的类别和等级。标度和类别检验广泛应用在估价产品一种或多种强度的强度、产品质量的评价。这种检验方法还可具体分为排序检验法、评估法、分等法、类别检验法、成对比较检验法等。
⑦ 对于R×C表资料的差异性检验,其相应的检验方法是什么,如何进行
医学论文中常用统计分析方法的合理选择
目前,不少医学论文中的统计分析存在较多的问题。有报道,经两位专家审稿认为可以发表的稿件中,其统计学误用率为90%-95%。为帮助广大医务工作者提高统计分析水平,本文将介绍医学论文中常用统计分析方法的选择原则及应用过程中的注意事项。 1.t 检验
t检验是英国统计学家W.S.Gosset 1908年根据t分布原理建立起来的一种假设检验方法,常用于计量资料中两个小样本均数的比较。理论上,t检验的应用条件是要求样本来自正态分布的总体,两样本均数比较时,还要求两总体方差相等。但在实际工作中,与上述条件略有偏离,只要其分布为单峰且近似正态分布,也可应用[2]。
常用的t检验有如下三类:①单个样本t检验:用于推断样本均数代表的总体均数和已知总体均数有无显着性差别。当样本例数较少(n<60)且总体标准差未知时,选用t检验;反之当样本例数较多或样本例数较少、总体标准差已知时,则可选用u检验 [3]。②配对样本t检验:适用于配对设计的两样本均数的比较,在选用时应注意两样本是否为配对设计资料。常用的配对设计资料主要有如下三种情况:两种同质受试对象分别接受两种不同的处理;同一受试对象或同一样本的两个部分,分别接受不同的处理;同一受试对象处理前后的结果比较。③两独立样本t检验:又称成组t检验,适用于完全随机设计的两样本均数的比较。与配对t检验不同的是,在进行两独立样本t检验之前,还必须对两组资料进行方差齐性检验。若为小样本且方差齐,则选用t检验;反之若方差不齐,则选用校正t检验(t’检验),或采用数据变换的方法(如取对数、开方、倒数等)使两组资料具有方差齐性后再进行t检验,或采用非参数检验[4]。此外,当两组样本例数较多(n1、n2均>50)时,这时应用t检验的计算比较繁琐,可选用u检验[5]。 2.方差分析
方差分析适用于两组以上计量资料均数的比较,其应用条件是各组资料取自正态分布的总体且各组资料具有方差齐性。因此,在应用方差分析之前,同样和成组t检验一样需要对各组资料进行正态性检验、方差齐性检验。
常用的方差分析有如下几类:①完全随机设计的方差分析:主要用于推断完全随机设计的多个样本均数所代表的总体均数之间有无显着性差别。完全随机设计是将观察对象随机分为两组或多组,每组接受一种处理,形成两个或多个样本。②随机区组设计的方差分析:
随机区组设计首先是将全部受试对象按某种或某些特性分为若干区组,然后区组内的每个研究对象接受不同的处理,通过这种设计,既可以推断处理因素又可以推断区组因素是否对试验效应产生作用。此外,由于这种设计还使每个区组内研究对象的水平尽可能地相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别。③析因设计的方差分析:将两个或两个以上处理因素的各种浓度水平进行排列组合、交叉分组的试验设计。它不仅可以检验每个因素各水平之间是否有差异,还可以检验各因素之间是否有交互作用,同时还可以找到处理因素的各种浓度水平之间的最佳组合。此外,还有正交设计、拉丁方设计等多种方差分析法,实验者在应用时可以参考相关的统计学着作。
目前,某些医学论文中有这样的情况,就是用t 检验代替方差分析对实验数据进行统计学处理,这是不可取的。t 检验只适用于推断两个小样本均数之间有无显着性差别,而采用t 检验对多组均数进行两两比较,会增加犯I 型错误的概率,即可能把本来无差别的两个总体均数判为有差别,使结论的可信度降低[6]。对多个样本均数进行比较时,正确的方法是先进行方差分析,若检验统计量有显着性意义时,再进行多个样本均数的两两(多重)比较。
3.卡方检验(χ2检验)
χ2检验是一种用途比较广泛的假设检验方法,但是在医学论文中常用于分类计数资料的假设检验,即用于两个样本率、多个样本率、样本内部构成情况的比较,样本率与总体率的比较,某现象的实际分布与其理论分布的比较。但是当样本满足正态近似条件时,如样本例数n与样本率p满足条件np与n(1— p)均大于5,则可以计算假设检验统计量u值来进行判断。
常用的χ2
检验分为如下几类:①2×2表χ2
检验:适用于两个样本率或构成比的比较,在应用时,当整个试验的样本例数n≥40且某个理论频数1≤T<5时,需对χ2
值进行连续性校正。因为T值太小,会导致χ2
值增大,易出现假阳性结论。此外,若样本例数n<40,或有某个T值<1,此时即使采用校正公式计算的χ2
值也有偏差,需要用2×2表χ2
检验的确切概率检验法(Fisher确切检验法)。②配对资料χ2检验:适用于配对设计的两个样本率或构成比的比较,即通过单一样本的数据推断两种处理结果有无显着性差别。在应用时,如果甲处理结果为阳性而乙处理结果为阴性的样本例数n1与甲处理结果为阴性而乙处理结果为阳性的样本例数n2之和<40,需要对计算的χ2
值进行校正。③R×C表χ2
检验:适用于多个样本率或构成比的比较。在R×C表χ2检验中,若检验统计量有显着性意义时,还需要对多个样本率或构成比进行两两比较,即分割R×C表,使之成为非独立的四格表,并对每两个率之间有无显着性差别作出结论。
2×2表资料在应用时可分为如下几种类型:横断面研究设计的2×2表资料、队列研究设计的2×2表资料、病例-对照研究设计的2×2表资料、配对研究设计的2×2表资料。研究者应注意不同类型的2×2表资料的统计分析方法略有差别,比如在分析队列研究设计的2×2表资料时,如果用χ2公式计算得到P<0.05,研究者则应再计算相对危险度(RR)并检验总体RR与1之间的差异是否具有统计学意义。
此外,在进行R×C表χ2检验时,还有如下两个主要的注意事项:首先,T值最好不要<5,若有1/5的T值<5,χ2检验结论是不可靠的,解决的办法有三种:增大样本量;删去T值太小的行和列;将T值太小的行或列与性质相近的邻行或邻列的实际频数合并。
其次,不同类型的R×C表资料选择的统计分析方法是不一样。①双向无序的R×C表资料:可以选用一般的χ2公式计算。②单向有序的R×C表资料:如果是原因变量为有序变量的单向有序R×C表资料,可以将其视为双向无序的R×C表资料而选用一般的χ2检验公式计算,但如果是结果变量为有序变量的单向有序R×C表资料,选用的统计分析方法有秩和检验、Radit分析和有序变量的logistic回归分析等。③双向有序且属性不同的R×C表资料:对于这类资料采用的统计分析方法不能一概而论,应根据研究者的分析目而合理选择。如果研究者只关心原因变量与结果变量之间的差异是否具有统计学意义时,此时,原因变量的有序性就显得无关紧要了,可将其视为结果变量为有序变量的单向有序R×C表资料进行分析。如果研究者希望考察原因变量与结果变量之间是否存在线性相关关系,此时需要选用处理定性资料的相关分析方法如Spearman秩相关分析方法等。如果两个有序变量之间的相关关系具有统计学意义,研究者希望进一步了解这两个有序变量之间的线性关系,此时宜选用线性趋势检验。如果研究者希望考察列联表中各行上的频数分布是否相同,此时宜选用一般的χ
因此,对于适用参数检验的资料,最好还是用参数检验。
秩和检验是最常用的非参数检验,它包括如下几类:①配对资料的符号秩和检验
(Wilcoxon配对法):是配对设计的非参数检验。当n≤25时,可通过秩和检验对实验资料进行分析;当n>25时,样本例数超出T界值表的范围,可按近似正态分布用u检验对实验资料进行分析。②两样本比较的秩和检验(Wilcoxon Mann-Whitney检验):适用于比较两样本分别代表的总体分布位置有无差异。如果样本甲的例数为n1,样本乙的例数为n2,且n1<n2;当n1≤10、n2—n1≤10时,可通过两样本比较的秩和检验对实验资料进行分析;当n1、n2超出T界值表的范围时,同样可按近似正态分布用u检验对实验资料进行分析。③多个样本比较的秩和检验(Wilcoxon Kruskal-Wallis检验):适用于比较各样本分别代表的总体的位置有无差别,它相当于单因素方差分析的非参数检验,计算方法主要有直接法和频数表法等。此外,在进行上述3类秩和检验(前两类秩和检验实际上已经被u检验替代)时,如果相同秩次较多,则需要对计算的检验统计量进行校正。
公式计算。④双向有序且属性相同的R×C表资料:这类资料实际上就是配对设计2×2表资料的延伸,在分析这类资料时,实验者的目的主要是研究两种处理方法检测结果之间是否具有一致性,因此常用的统计分析方法为一致性检验或Kappa检验。
4. 非参数检验
非参数检验可不考虑总体的参数、分布而对总体的分布或分布位置进行检验。它通常适用于下述资料[2]:①总体分布为偏态或分布形式未知的计量资料(尤其样本例数n<30时);②等级资料;③个别数据偏大或数据的某一端无确定的数值;④各组离散程度相差悬殊,即各总体方差不齐。该方法具有适应性强等优点,但同时也损失了部分信息,使得检验效率降低。即当资料服从正态分布时,选用非参数检验法代替参数检验法会增大犯Ⅱ类错误的概率。
⑧ 组间差异检验,终于有人讲清楚了!
什么是组间差异检验?就是组间的差异分析以及显着性检验,应用统计学上的 假设检验 方法,检验组间是否有差异及其差异程度。坦率地讲,所有的差异检验都基于一个假设:组间没有差异,变量之间没有关系(即原假设, )。上海交大王成老师也说方差分析其实研究的就是不同水平下是否有差异化的假设检验问题。而假设检验就是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
所以,本着负责的态度,在本文的开始我们有必要回顾一下《概率论与数理统计》中关于假设检验的基本概念。
其中 参数 这个概念最值得我们好好体会,因为今天的主角 组间差异检验 ,在这个水平上可以分为两类:参数检验和非参数检验。那么什么叫参数检验和非参数检验,它们之间的区别是什么呢。要理解前面的问题,首先需要明白统计推断的概念。
统计推断是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。总体的参数一般是未知的,通常可以用样本统计量来对总体的参数进行估计,例如可以用样本均值对总体均值进行点估计,利用样本均值的分布对总体均值进行区间估计,这些都称为参数估计。
参数检验和非参数检验的区别:
那么什么时候用参数检验,什么时候用非参数检验呢?非参数检验一般不直接用样本观察值作分析,统计量的计算基于原始数据在整个样本中的秩次,丢弃了观察值的具体数值,因此凡适合参数检验的资料,应首选参数检验。但是不清楚是否合适参数检验的资料,则应采用非参数检验。
此处也许大家期待作者带我们温习一下假设检验的4 个步骤(提出假设;构造检验统计量;根据显着水平,确定临界值和拒绝域;做出检验决策),但是带有几分傲气的作者绝情地不为我们没有学好的课程补刀,补课的事情让我们自己去做,他转而讲自己认为重要的知识点:抽样分布。
知道我们的研究对象整体处于什么状态,是一件非常重要的事情。三大抽样分布( -分布、 分布、 -分布)和正态分布共同构成了现代数理统计学的基础,其中,正态分布和 -分布是关于均值的分布; 分布、 -分布是关于方差的分布。很多同学做统计做了很多年,却不知道为什么几乎每个方差分析都有 值。可见,统计学拼到最后拼的都是 基础 。
离开分布,假设检验无从谈起;离开假设检验,差异分析毫无根基。同样地,出于人道主义,我们来重温一下抽样分布。
设 X 1 ,X 2 ,......X n 相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ 2 =X 1 2 +X 2 2 +......+X n 2 所服从的分布为自由度为 n 的 分布
设 服从标准正态分布N(0,1), 服从自由度为n的 分布,且 、 相互独立,则称变量 所服从的分布为自由度为n的 -分布
设 服从自由度为 的 分布, 服从自由度为 的 分布,且 、 相互独立,则称变量 所服从的分布为 分布,其中第一自由度为 ,第二自由度为 。一般滴,这里F就是均方之比。
不管是参数检验还是非参数检验,都要基于特定的分布来做假设检验。当总体分布已知时,例如总体服从正态分布,我们可以根据给定的显着性水平(通常为0.01 或0.05)查表获得临界值。当总体分布未知时,可以先用Permutation test 构造经验分布,再根据显着性水平获得临界值。
传统的统计量检验的方法是在检验之前确定显着性水平 ,也就意味着事先确定了临界值和拒绝域。这样,不论检验统计量的值是大还是小,只要它的值落入拒绝域就拒绝原假设,否则就不拒绝原假设。这种给定显着性水平的方法,无法给出观测数据与原假设之间不一致程度的精确度量。要测量出样本观测数据与原假设中假设值的偏离程度,则需要计算pvalue值。pvalue 值,也称为观测到的显着性水平,它表示为如果原假设 正确时得到实际观测样本结果的概率。pvalue 值越小,说明实际观测到的数据与 之间的不一致的程度就越大,检验的结果就越显着。
变量较多,判断组间差异时需要多重检验的情况在宏基因组扩增子差异分析中十分常见。这种情况下,基于单次比较的检验标准将变得过于宽松,使得阳性结果中的错误率(FDR 值FalseDiscovery Rate)非常大(已经大到令人不可忍受的地步)。怎么办呢?最好的办法就提高判断的标准(p value),单次判断的犯错概率就会下降,总体犯错的概率也将下降。在多重检验中提高判断标准的方法,我们就称之为 多重检验校正 。从1979 年以来,统计学家提出了多种多重检验校正的方法。相应地,对p值校正之后的叫法也不一样,比如,FDR、Q value、Adjusted p-value,这个大家知道在多重检验时需要校正就行了,具体的用法作者有时间再教大家(这个作者真是皮啊~~)。
关于宏基因组或扩增子组间差异检验的理论知识就到这了,作者认为知道以上知识点是必要的,也告诉我们,今天我们讨论的是统计推断。换句话说,找差异,我们是专业的。
人民为了找差异,这才学会做统计。为了说明组间的数据差异很大,人民开发了许多沿用至今的图画,下面我们就一起来揭开这一幅幅有差异的画面。
在数据科学家的工具箱里,这是一款经久不衰、常用常新的瑞士军刀。几乎只要想到差异分析,就会想到箱线图。也开发出类箱线图的工具比如小提琴图(小提琴图Violin plot)
一般有进化树和层次聚类树,如果你想表达对象之间的距离差异,最直观的的也许就是树状图了。为了用图表示亲缘关系,把分类单位摆在图上树枝顶部,根据分枝可以表示其相互关系,具有二次元和三次元。在数量分类学上用于表型分类的树状图,称为表型树状图(phenogram),掺入系统的推论的称为系统树状图(cladogram)以资区别。
贴心的作者小朋友把实现这些图形的常见R包列给大家,安装后就能用啦
这里说的基于物种言下之意是通过统计分析,可以有针对性的找出分组间丰度变化差异显着的物种,并得到差异物种在不同分组间的富集情况,同时,可以比较组内差异和组间差异的大小,判断不同分组间的群落结构差异是否具有显着意义。也就是说可以找出区别组间的一个biomarker。
这类检验一般只输出p值,它的目的很简单,就是检验比较组之间的相似性距离是否有差异。常用的分析方法有卡方检验、Student t检验、Wilcoxon秩和检验等等。
如果只有两个样本比较,适合用卡方检验 ,不过说实在的,检验出来的结果没什么可靠性,因为现阶段16s研究不做重复实在“难以服众”了。先不说价格便宜,做重复压根没有难度,就是从生物学、统计学角度考虑,也需要做重复。
如果是两组样本(至少3重复),可以试一下Student t,Welch‘st以及Wilcoxon秩和检验 。Student t检验需要样本符合正态分布,而且方差对齐。当组间样本数不同,方差也不对齐的时候,Welch’s t检验是很好的选择。
Wilcoxon秩和检验又叫Mann-Whitney U 检验,是基于变量排名的一种统计方法,不需要样本符合正态分布,也不需要样本方差对齐,是更为广泛的检验方法,但同时也由于检验太宽松,容易带来很多假阳性。
如果是多组样本比较,可以选择one way ANOVA、TURKEY以及Kruskal-Wallis H检验等方法 。one way ANOVA和TURKEY其实都是基于方差分析,只不过后者带有后验,可以知道两个分组对整体差异的贡献度。
Kruskal-Wallis H检验本质也是一种秩和检验,与前两者的区别在于,它不需要样本数和方差的对齐,应用更为广泛。Kruskal-Wallis检验又被称之为单因素非参数方差分析。
毫不客气地讲,一般秩和检验或置换检验属于非参数检验。在这类差异检验中,有两种集成方法特别值得我们注意:LEfSe 、metastats。
得到结果展示如下,差异体现在柱形图和树状图上。LDA值分布柱状图中展示了LDA Score大于设定值(默认设置为4)的物种,即组间具有统计学差异的Biomarker。展示了不同组中丰度差异显着的物种,柱状图的长度代表差异物种的影响大小(即为 LDA Score)。
在进化分支图中,由内至外辐射的圆圈代表了由门至属(或种)的分类级别。在不同分类级别上的每一个小圆圈代表该水平下的一个分类,小圆圈直径大小与相对丰度大小呈正比。着色原则:无显着差异的物种统一着色为黄色,差异物种Biomarker跟随组进行着色,红色节点表示在红色组别中起到重要作用的微生物类群,绿色节点表示在绿色组别中起到重要作用的微生物类群,若图中某一组缺失,则表明此组中并无差异显着的物种,故此组缺失。图中英文字母表示的物种名称在右侧图例中进行展示。
metastats结果给出差异物种的p值和q值(表中 的数据是假的!)
所谓基于距离也就是检验的是群落差异而不是某个物种。上面所提及的检验方法,其实都只能告诉大家,这些分组是否有显着差异(可以简单理解为有无)。那如果想同时知道这些差异的程度(可以简单理解为多少)呢,那需要Anosim,Adonis以及MRPP等检验方法。这些方法不但可以输出检验显着性结果(p值),还有程度结果(R值),R值可以用来判断分组贡献度大小。Anosim、Adonis这些可用于多元统计检验的模型就非常适合了。要值得注意的是,Anosim本质是基于排名的算法,其实与NMDS的配合效果最好。如果是PCoA分析,建议配合使用Adonis检验结果。
Anosim(Analysis of similarities)是一种非参数检验方法。它首先通过变量计算样本间关系(或者说相似性),然后计算关系排名,最后通过排名进行置换检验判断组间差异是否显着不同于组内差异。这个检验有两个重要的数值,一个是p值,可以判断这种组间与组内的比较是否显着;一个是R值,可以得出组间与组内比较的差异程度。Anosim用来检验组间的差异是否显着大于组内差异,从而判断分组是否有意义,Anosim分析使用R vegan包anosim函数,一般基于Bray-Curtis距离值的秩次进行组间差异显着行检验,详细计算过程可查看 Anosim 。
该方法主要有两个数值结果:一个是R,用于不同组间否存在差异;一个是P,用于说明是否存在显着差异。以下分别对两个数值进行说明:
R值的计算公式如下:
rB:组间差异性秩的平均值(mean rank of between group dissimilarities)
rW:组内差异性秩的平均值(mean rank of within group dissimilarities)
n:总样本个数(the number of samples)
R的范围为[-1,1]
R>0说明组间差异大于组内差异,R<0组间差异小于组内差异。
R只是组间是否有差异的数值表示,并不提供显着性说明。
P值则说明不同组间差异是否显着,该P值通过置换检验(Permutation Test)获得。
置换检验大致原理:(假设原始分组为实验组和对照组)
1、对所有样本进行随机分组,即实验组和对照组。
2、计算当前分组时的R值,即为Ri。
3、重复当前操作N次,对所有Ri及原始R从大到小排序,R所处的位置除以N即为置换检验P值。
ADONIS又称置换多因素方差分析(permutational MANOVA)或非参数多因素方差分析(nonparametric MANOVA),是一种基于Bray-Curtis距离的非参数多元方差分析方法。它与Anosim的用途其实差不多,也能够给出不同分组因素对样品差异的解释度(R值)与分组显着性(P值)。不同点是应用的检验模型不同,ADONIS本质是基于F统计量的方差分析,所以很多细节与上述方差分析类似。该方法可分析不同分组因素对样本差异的解释度,并使用置换检验对分组的统计学意义进行显着性分析。ADONIS分析使用R vegan包adonis函数进行分析,详细计算过程可 adonis
MRPP分析与Anosim类似,但是MRPP是基于Bray-Curtis的参数检验,用于分析组间微生物群落结构的差异是否显着,通常配合PCA、PCoA、NMDS等降维图使用,MRPP分析使用R vegan包mrpp函数,详细计算过程可查看 MRPP
分子方差分析法 (AMOVA)与ANOVA类似,是基于加权或非加权Unifrac距离矩阵,检验不同组间差异显着性的非参数分析方法。一般基于Unifrac距离,使用mothur软件amova函数进行组间差异分析,详细计算过程可查看 Amova
Mantel test,Mantel test 是对两个矩阵相关关系的检验,顾名思义,是一种检验。既然是检验就得有原假设,它的原假设是两个矩阵见没有相关关系。检验过程如下:两个矩阵都对应展开,变量两列,计算相关系数(理论上什么相关系数都可以计算,但常用pearson相关系数),然后其中一列或两列同时置换,再计算一个值,permutation 成千上万次,看实际的r值在所得r值分布中的位置,如果跟随机置换得到的结果站队较近,则不大相关,如果远远比随机由此得到显着性。详细计算过程可查看 Mantel test
作者实在太懒,坚持别人已经说过的话不愿再说,只要抄过来就好了,在文章的最后他把赵小胖的一段话原版搬了过来:
无论你从事何种领域的科学研究还是统计调查,显着性检验作为判断两个乃至多个数据集之间是否存在差异的方法被广泛应用于各个科研领域。笔者作为科研界一名新人也曾经在显着性检验方面吃过许多苦头。后来醉心于统计理论半载有余才摸到显着性检验的皮毛,也为显着性检验理论之精妙,品种之繁多,逻辑之严谨所折服。在此,特写下这篇博文,以供那些仍然挣扎在显着性检验泥潭的非统计专业的科研界同僚们参考。由于笔者本人也并非统计专业毕业,所持观点粗陋浅鄙,贻笑大方之处还望诸位业界前辈,领域翘楚不吝赐教。小可在此谢过诸位看官了。
参考:
⑨ 11、固定参照模型的二-三点检验时注意事项有哪些
注意编码样品。
三点检验法是差别检验当中最常用的一种方法,具体是:在检验中,同时提供3个编码样品,其中两个是相同的,另外一个样品与其他两个样品不同。
⑩ 有实验组控制组的测试结果,欲检验其是否存在显着差异,应选用哪些可用的方法
当试验数据出现两种或者多种不同的结果时,应该采用统计学的方法,通过显着性检验来判断试验数据之间是否存在显着性差异。
显着性检验的方法通常有t检验法和F检验法:
t检验用来检测两组数据的准确度,确定是否存在系统误差
F检验又叫方差齐性检验,用来检测两组或多组数据的精密度,确定是否存在偶然误差
计算公式和查表之类的就不写了,太复杂,而且你手上应该都有
针对你的数据,如果只是“需要看一下两组差别是不是很大”,只用F检验即可
如果你需要确定数据是否存在系统误差,或是否与假设结论是否相符时,则需要用到t检验
提醒一句,若要进行t检验,首先得进行F检验,用以判断两组数据的方差齐性
若两组数据方差相等,则用t检验;若方差不等,则用变种的t'检验
总之,不论怎样,都要用到F检验