A. 单因素方差分析的步骤是什么
单因素方差分析 (one-way ANOVA),用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。
完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。
完全随机设计的单因素方差分析是把总变异的离均平方和SS及自由度分别分解为组间和组内两部分,其计算公式如下。
MS组间=离均平方和/组间自由度
MS组内=离均平方和/组内自由度
SS总=SS组间+SS组内
单因素方差分析:核心就是计算组间和组内离均差平方和。两组或两组以上数据,大组全部在一组就是组内,以每一组计算一均数,再进行离均平方和的计算:
SS组间=组间离均平方和,MS组间=SS组间/组数-1(注:离均就有差的意思了!!)
SS组内=组内离均平方和,MS组内=SS组内/全部数据-组数
F值=MS组间/MS组内
查F值,判断见下面的分析步骤部份。
B. 请问spss里面如何进行单因素方差校正最好有详细点的步骤。非常感谢。
是单因素方差分析吧。
请参考我以前的回答:
http://..com/question/96709055.html
http://..com/question/95390471.html
http://..com/question/94635457.html
http://..com/question/92116424.html
http://..com/question/91693980.html
C. 这是用单因素重复测量方差分析的结果,请问结果怎么看好像球形检验不成立,这样应该怎么办 谢谢!
在报告结果的时候要写成如下形式:F(1.05, 10.46)=5.630, p<0.05。
在重复测量方差分析球形检验未通过时,需要对结果,或者说对p值进行校正,对此有几种校正方法。如最后一张表中的Greenhouse-Geisser和Huynh-Feldt就是两种校正方法,用第一种校正方法的比较多。
这时报告的自由度就是校正方法后面相应的自由度而非原来的(3,30)。由于数据不符合球形假设,p值就成了0.037,而非原来的0.003,这是校正之后的结果。
原理
方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。
(2)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw。总偏差平方和 SSt = SSb + SSw。
以上内容参考:网络-方差分析
D. 单因素方差分析spss步骤
单因素方差分析spss步骤如下所示:
操作工具:win10电脑。
操作软件:SPSS分析工具。
操作版本:1.32.5。
1、首先通过快捷方式打开SPSS分析工具,默认显示数据视图。
Spss自动计算F统计值,如果相伴概率P小于显着性水平a,拒绝零假设,认为控制变量不同水平下各总体均值有显着差异,反之,则相反,即没有差异。
方差齐性检验:控制变量不同水平下各观察变量总体方差是否相等进行分析。采用方差同质性检验方法,原假设“各水平下观察变量总体的方差无显着差异,思路同spss两独立样本t检验中的方差分析”。 相伴概率0.515大于显着性水平0.05,故认为总体方差相等。
两类方差异同
两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS配伍+SS误差。
E. 单因素方差分析的适用场景及其分析过程
方差分析用于定类数据(X)与定量数据(Y)之间的差异分析,例如研究三组学生(X)的智商平均值(Y)是否有显着差异。其中X的组别数量至少为2,也可以分析三个或三个以上组别的数据。
定类数据是指数字大小代表分类的数据(如1=男,2=女;1=第一组,2=第二组,3=第三组),定量数据是指数字大小具有比较意义(如量表题:非常不满意,比较不满意,中立,比较满意,非常满意)
如果X为定类,Y为定量;且X分为两组,比如男和女;此时也可使用t检验进行差异对比。T检验与单因素方差分析的区别在于T检验只能对比两组数据的差异。
如果X和Y均为定类数据,想对比差异性,此时需要使用卡方分析。
02. 格式要求
在分析前首先需要按正确格式录入、上传才能得到有效的分析结果。针对方差分析,正确的录入格式如下图所示:
正态图
方差齐性检验是用于判断不同组别下的数据波动情况是否一致,即方差齐。若P值呈现出显着性(p <0.05)则说明,不同组别数据波动不一致,即说明方差不齐;反之p值没有呈现出显着性(p>0.05)则说明方差齐。
同样的,方差分析前也需要进行方差齐性检验,理论上数据进行方差齐检验没有呈现出明显显着性(即P>0.05),才可使用方差分析,但一般来讲如果不满足方差齐条件,检验性能也较好,因而多数时候并没有进行方差齐检验就直接使用方差分析(方差齐检验可在SPSSAU通用方法->方差中使用)。
F. 方差分析
单因素独立样本固定效应方差分析分析总结——效应量及其置信区间、Power、趋势分析
数据文件:OA3.sav,R中为OA3
模拟数据:
R:
n1<-n2<-n3require(pwr);require(MBESS);require(multicomp);require(car)
1 假设检验:
Anova(lm(Happy~ Type,data=OA3,contrasts=list(Type=contr.sum)),type=”III”)
##要注意当TypeIII和TypeII两者不一样的时候,需要加入语句:contrasts=list(fcategory=contr.sum, partner.status=contr.sum) ##Coding,适用TypeIII方法
参考R帮助文件>example(Anova)
(注:Type II和Type III的区别:
在没有交互作用,或不同组之间的被试数比例与总体比例相同时二者无区别;
Type II在有交互作用,且不同组之间的被试数比例与总体比例相同时适用;
Type III在有交互作用,总体为等比例但样本为不等比例时适用。
亦可以回归的方式来做:
lm.OA3<-lm(Happy~ Type,data=OA3)
summary(lm.OA3)
得到的结果中后面会用到的是:
R2=0.3719,F(2,90)=26.648
(注:回归方法当中只报告回归的一些参数,不报告SS,但是报告R2(SPSS中不报告),方便接下来计算f2(f2的求法列在下面))
2 效应量及其置信区间
①Cohen’s f2及其置信区间
f2=0.3719/(1-0.3719)
= 0.5921032
##Cohen’f2=R^2/(1-R^2 )(where R2 is the squared multiple correlation)
##参考
##Cohen’f2=ncp/N(N=n*k)
ci.ncp<-conf.limits.ncf(F.value=26.648,conf.level=0.95,df.1=2,df.2=90) ##求ncp置信区间
lambda <- c(ci.ncp$Lower.Limit,ci.ncp$Upper.Limit); ##以置信区间的形式显示结果
因为f2=ncp/N (N=nK)
sqrt(ci.f2 <- lambda / N); (进行转化)
#求非中心参数ncp的置信区间,然后根据ncp和f2的关系来求得f2的置信区间#
根据上面两个式子可得:f2的置信区间是(0.5151149 0.9806293)
②求η2及其置信区间
η2= SSeffect / SStotal
在单因素方差分析当中,因为只有一个自变量,η2=R2,所以η2=0.3719
在SPSS当中用Analyze——General Linear Model——Univariate来进行单因素方差分析可以收集到ηp2、R2、校正R2等数据,而且可以进行更复杂的Contrast。
方差分析结果
由noncf.sav计算得到的结果(前四项手工输入,最后三项为所需要的结果):
可知η2置信区间为: [0.20966,0.49021]
其实更简单的方法是在R中直接根据f2与η2的代数关系换算出η2的置信区间(^_^)。
③求ω2
ω2 = (SSeffect - (dfeffect)(MSerror)) / (MSerror + SStotal)=(1280.416-2*24.025)/(24.025+3442.627)
= 0.3554917
当前没有求总体ω2置信区间的统计技术
参考《Experimental Design Using ANOVA》:P114。
注:ω2置信区间和η2置信区间的文献常见的问题是没有定义总体值而直接谈置信区间,这是范式上的错误。
④求ηp2(偏η2)
ηp2 = SSeffect / (SSeffect + SSerror)
=η2
=0.3719
置信区间为:[0.20966,0.49021]
两者相等可以从他们的公式看出来:
η2= SSeffect / SStotal
ηp2 = SSeffect / (SSeffect + SSerror)
η2在分母当中包括了其他自变量的效应。而在单因素方差分析中只有一个自变量,所以两者相等。
注:在多因素方差分析中,需要根据两者的代数关系来求ηp2的置信区间。
如果自变量是随机因素(Random Factor),还可以求效应量指标为。这里只给出计算公式:
= (MSeffect - MSerror) / (MSeffect + (dfeffect)(MSerror))
其他的效应量还包括:Glass’sΔ、Hedges’ g等。
各效应量之间的比较:
η2和ηp2是对特定样本效应量的描述统计量,是对效应量总体参数的有偏估计,而ω2是对作为总体参数的效应量的无偏点估计。因此η2和ηp2会高估效应量,所以ω2比η2和ηp2小一点。根据公式:
η2= SSeffect / SStotal
ηp2 = SSeffect / (SSeffect + SSerror)
可以看出η2会随着自变量的变多而变小,无法准确体现一个自变量的“效应”,而ηp2则不会。根本原因是η2的的分母中是总和方SStotal,而ηp2的分母是效应变异和误差变异的和(SSeffect+SSerror),因此ηp2不随自变量的增多而变小。但也是正因为如此,各自变量的ηp2 之和不等于1。总的来说,η2的值描述的是在样本当中自变量所产生的变异效果。对于自变量效应量的总体估计值是ω2。
3 Power
pwr.f2.test(u=2,v=90,f2=0.5921032,sig.level=0.05)
Power的主要作用是在研究开始前估计样本量。但是在统计分析之后如果研究结果不显着,可以通过求Power来看还需要多少样本才能够获得显着性结果。
4 Post Hoc
require(multcomp)
g<-glht(lm.OA3, linfct = mcp(Type =c(”Senior-Mid=0〃,”Senior-Youth=0〃,”Mid-Youth=0〃)))
注:必须将所有的差异都写出来,不能一次只单独求一个差值:
g<- glht(lm.OA3, linfct = mcp(Type =c(”Senior-Mid=0,”)))
注:这是单个Planned test(事前检验)的做法。如果是多个检验,根据所要做的比较的次数会有对α的校正,因此求出的置信区间会比不做校正的要大。事后检验在数学上与对应的多个事前检验结果一样(比如:包括三次比较的时候检验与做了三个比较的事前检验结果是一样的)。因为简单主效应是事后检验,应该进行α的校正,所以在R中应该同时写出三个比较(有几个比较写几个比较)。
R中采用的是Turkey HSD的做法,结果与SPSS一致。如果在R中只进行一次比较,结果与SPSS中Post Hoc里面的LSD方法相同,也就是说SPSS当中的LSD方法没有对α进行校正。
summary(g) ##可以看显着性检验的结果
confint(g) ##求老年人与中年人的简单主效应的置信区间
## 关于事后检验的具体方法和优劣参考
求非标准化简单主效应
非标准化简单主效应就是指并非简单的差值比较,而是较为复杂的多重比较:比如老年人和中年人的平均值与青年人的差值的显着性检验。
g<- glht(lm.OA3, linfct = mcp(Type =c(”0.5*Senior + 0.5*Mid – Youth=0〃)))
##比较老年人和中年人的平均值与青年人的快乐指数
summary(g) ##显着性检验结果
confint(g) ##求置信区间:
在SPSS中选择Contrast,在Coefficients当中依次填入-1,0.5,0.5。结果与R一致。
注:这里面要注意一点:指定的系数之和必须是0才能保证各组之间的变异是正交的。
另外在网上提供的做法当中填入的系数为-2,1,1,虽然最后的显着性结果是一致的,但这个时候差值的点估计就不和题目相对应了,所以建议用第一种方法指定系数。)
SPSS做法
其中包括了SPSS的Syntax语句。
在进行Contrast比较的时候就涉及到Coding(指定各水平系数)和Orthogonality(正交性)的问题。首先在自变量、水平之间是独立的假设成立的前提下,Coding要保证系数之和等于0,这样就能保证水平之间是正交的。正交的好处在于将效应量完全独立的分解,每次比较不会有重复的部分。如图:
正交
当样本量不一致时就很不能保证正交。
注:这里所提到的Coding指的是对各个哑变量的系数赋值的过程。
参考《Experimental Designs Using ANOVA》P124
事后检验方法
事前检验的效力比事后检验更高。只有在没有条件进行事前检验、或者没有明确的理论预期的时候才进行事后检验。
常用的Post Hoc有LSD、Scheffe、Turkey HSD、Bonferroni等。
LSD需要等组条件,并且没有对α进行校正,在进行较多检验的时候会提高犯一类错误的可能。
Scheffe过于保守,损失大量的Power。但特别适用于不等组情况。
Turkey HSD要求等组。在SPSS中对α进行了校正。
5 趋势分析(Trend Analysis):
在SPSS中的Contrast选项中选择Polynomial。3个水平最多只能是二次型(Quadratic)。
SPSS中趋势分析结果为:
趋势分析
线性趋势结果显着(F=51.083,p0.001),Quadratic趋势不显着(F=2.213,p>0.001)。这里的Deviation就相当于回归分析当中的残差。
去101学习辅导答疑网看看,那里有专业的老师在线回答问题的!现在注册还免费送金豆!
G. 单因素方差分析房差不齐的时候怎么办用什么方法,真的求大神指教一下,尽可能详细一些!
建议你打开统计学的课本,梳理一下看是不是数值有误或者未知数参数什么的是不是搞反了。。还是你在使用统计系统的时候操作有误,无能为力还给老师了
H. 干货!单因素方差分析步骤梳理!
一、前期准备
1.研究目的
方差分析(单因素方差分析),用于分析定类数据与定量数据之间的关系情况。例如研究人员想知道三组学生的智商平均值是否有显着差异。方差分析可用于多组数据,比如本科以下,本科,本科以上共三组的差异;而下述t 检验仅可对比两组数据的差异。
2.分析要求
分析的大致要求如下:
异常值: 如果数据有异常值,比如本身数据全部应该大于0,但却出现小于0的数字【可使用SPSSAU通用方法里的频数分析,或者描述分析等进行检查】。可以使用SPSSAU“数据处理”模块下的异常值处理,右侧分析框可以设置“判断标准”
如有异常值,可以对异常值进行处理设为Null或者用平均值、中位数、众数、随机数等进行填补。
SPSSAU帮助手册:异常值
正态分布: 方差分析理论上是要求数据服从正态分布的,但是理论上的正态分布很难满足,数据接近于正态分布更符合实际情况,因此接近正态分布的数据直接使用方差分析即可,也可以说方差分析对于正态性的要求是稳健的。
方差齐性: 一般来讲,方差轻微不齐仅会对方差分析的结论有少许影响。如果方差不齐可以使用其他分析方法,例如:Welch anova、Brown-Forsythe anova。
3.数据格式
方差分析是研究不同组别的差异,比如不同学历时满意度的差异。因此数据格式中一定需要有组别X(比如学历)和分析项Y(比如满意度)。
有时候只有分析项(比如3个分析项),但是现在希望此3个分析项的差异,那么就需要对数据进行改造,自己加入一列‘组别’,然后把数据重叠起来得到分析项Y,类似如下图:
二、SPSSAU操作
1.上传数据
登录账号后进入SPSSAU页面,点击右上角“上传数据”,将处理好的数据进行“点击上传文件”上传即可。
2.拖拽分析项
在“通用方法”模块中选择“方差”方法,将X定类变量放于上方分析框内,Y定量变量放于下方分析框内,点击“开始分析”即可。
3.选择参数
方差分析方法中有以下4个方法供研究者选择,分别是方差分析、方差齐检验、Welch anova、Brown-Forsythe anova。
方差分析: 分析定类数据与定量数据之间的关系情况。
方差齐检验: 用于分析不同定类数据组别,对定量数据时的波动情况是否一致。
Welch anova: 采用Welch分布的统计量进行的各组均值是否相等的检验
Brown-Forsythe anova: 采用Brown-Forsythe分布的统计量进行的各组均值是否相等的检验。
补充说明: 如果数据不满足方差齐性也可以使用Welch anova以及Brown-Forsythe anova。
三、SPSSAU分析
1.方差分析结果对比
案例背景: 分析不同学历之间的工作人员薪资是否有差异。其中1.0代表高中毕业,2.0代表专科,3.0代表本科学历,4.0代表研究生学历(数据只适用于此案例分析)。
学历对于薪资呈现出0.05水平显着性(p=0.000<0.05)同时也可以使用折线图进行直观展示。总结可知:不同学历样本对于薪资全部均呈现出显着性差异。
2.方差分析图对比
上述折线图展示的是学历和薪资方差分析对比,从图中可以看出不同学历样本对于薪资均有着差异性。
3.效应量指标
补充说明 :除此之外SPSSAU还提供了方差分析中间过程值表以及方差分析结果的普通格式以及简化纵向格式,如下:
(1)方差分析中间过程值:
(2)方差分析结果(普通格式)
(3)方差分析结果(简化纵向格式)
四、其他说明
Q1.几种差异性分析
如果X和Y均为定类数据,想对比差异性,此时需要使用卡方分析。如果X为定类,Y为定量;且X分为两组,比如男和女;此时也可使用t 检验进行差异对比(当然也可使用方差分析)。总结如下表:
Q2. 方差分析中间过程值,组间平方和、组内平方和、自由度、均方等问题?
方差分析用于研究差异,差异共由两部分组成,分别是组间平方和,组内平方和;同时对应着自由度值等;计算分别如下:
组间自由度df 1=组别数量 – 1;
组内自由度df 2 = 样本量 – 组别数量;
组间均方 = 组间平方和 / 组间自由度df1;
组内均方 = 组内平方和 / 组内自由度df2;
F 值 = 组间均方 / 组内均方;
p 值是结合F 值,df 1和df 2计算得到。
五、总结
理论上讲,方差分析前需要满足方差齐,如果方差齐则使用方差分析,如果方差不齐则使用非参数检验。理论和实践相比,永远有gap,现实研究中,最常见的依然是方差分析(而不是非参数检验),原因在于非参数检验的检验效能相对于方差分析会低一些。在方差分析时SPSSAU会自动处理方差齐性问题。
以上就是单因素方差分析步骤的全过程!更多干货请登录SPSSAU官网,进行查看。
SPSS在线_SPSSAU_SPSS方差分析
I. 方差分析中方差齐性时常用的多重比较检验方法有哪些
1、图基法(Tukey's Method)又称T多重比较法,是用来比较均值 和 (g≠h)的所有可能的两两差异的一种联立检验( a simultaneous test) ( Tukey,1953)。目标是为所有两两比较构建100(1-α)%的置信区间。
这种方法的基础是学生化的极差分布( studentized range distribution)。令r为从均值为μ、方差为σ2的正态分布中得到的一些独立观察的极差(即最大值减最小值),令v为误差的自由度数目(多重比较中为N-G)。
2、谢弗法( Scheffé's method) 又称S多重比较法,也为多重比较构建一个100(1 -α) %的联立置信区间( Scheffé,1953,1959)。区间由下式给出:
表示自由度为G-1和N-G的F分布的100(1 -α)百分数点。
谢弗法更具有普适性,因为所有可能的对比都可用它来检验统计显着性,
而且可为参数的相应线性函数构建置信区间
(9)单因素方差分析的校正方法扩展阅读
图基法和谢弗法的比较
作为两种主要的多重比较方法,图基法和谢弗法各有其优缺点,总结如下:
1、谢弗法可应用于样本量不等时的多重比较,而原始的图基法只适用于样本量相同时的比较。
2、在比较简单成对差异( simple pairwise differences)时,图基法最具效力,给出更窄的置信区间,虽然它对于广义比对( general contrasts) 也可适用。
3、与此相比,对于涉及广义比对的比较,谢弗法更具效力,给出更窄的置信区间。
4、如果F检验显着,那么谢弗法将从所有可能的比对(contrasts)中至少检测出一对比对是统计显着的。
5、谢弗法应用起来更为方便,因为F分布表比图基法中使用的学生化极差分布更容易得到。
6、正态性假定和同方差性假定对于图基法比对于谢弗法更加重要