‘壹’ 如何检验一个样本的正态分布情况
判断正态分布的方法如下:
一、正态性检验:偏度和峰度。
1、偏度(Skewness):描述数据分布不对称的方向及其程度。
当偏度≈0时,可认为分布是对称的,服从正态分布;
当偏度>0时,分布为右偏,即拖尾在右边,峰尖在左边,也称为正偏态;
当偏度<0时,分布为左偏,即拖尾在左边,峰尖在右边,也称为负偏态;
2、峰度(Kurtosis):描述数据分布形态的陡缓程颂李度。
当峰度≈0时,可认为分布的峰态合适,服从正态分布(不胖不瘦);
当峰度>0时,分布的峰态陡峭(高尖);
当峰度<0时,分布的峰态平缓(矮胖);
3、SPSS操作方法。
4、结果解读。
二、正态性检验:图形判断。
1、直方图:表示连续性变量的频数分布野颤迟,可以用来考察是否服从正态分布
选择“图形”下拉菜单中的“旧对话框”,选择“旧对话框”中的“直方图”;
把变量“x2”放入变量框中,勾选“显洞尘示正态曲线”;
2、P-P图和Q-Q图。
(1)P-P图反映了变量的实际累积概率与理论累积概率的符合程度,Q-Q图反映了变量的实际分布与理论分布的符合程度,两者意义相似,都可以用来考察数据资料是否服从某种分布类型。若数据服从正态分布,则数据点应与理论直线(即对角线)基本重合。
(2)SPSS操作:
选择“分析”下来菜单中的“描述统计”,及“描述统计”下的“P-P图”;
选择变量,及勾选正态分布;生成如下图形。
三、正态性检验:非参数检验方法。
‘贰’ 判断正态性的几种方法总结
数据服从正态分布是很多分析方法的前提条件,在进碧竖丛行方差分析、回归分析等分析前,首先要对数据的正态性进行分析,确保方法选择正确。如果不满足正态性特质,则需要考虑使用其他方法或对数据进行处理。
检测数据正态性的方法有很多种,以下为几种常见方法:图示法、统计检验法、描述法等。
正态分布图可直观地展示数据分布情况,并结合正态曲线判断数据是否符合正态分布。
分析时,选择【正态图】分析方法,拖拽分析项到右侧分析框内,点击“开始正态图分析”即可得到结果。悔樱
若数据基本符合正态分布,则会呈现出中间高、两侧低、左右基本对称的“钟形”分布曲线。
若数据为定类数据或数据量较少,一般很难呈现出标准的正态分布纤闭,此时建议只要图形呈现出“钟形”也可接受数据服从正态分布。
若数据分布完全偏离正态,则说明数据不符合正态分布。
P-P图和Q-Q图,都是通过散点与正态分布的预测直线法重合程度以说明数据是否服从正态分布。
P-P图是将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图,反映实际累积概率与理论累积概率的符合程度。
Q-Q图将实际数据作为X轴,将对应正态分布分位数作为Y轴,作散点图,反映变量的实际分布与理论分布的符合程度。
如数据服从正态分布,则散点分布应近似呈现为一条对角直线。反之则说明数据非正态。P-P图和Q-Q图的功能一致,使用时没有区别。
利用统计图分析正态性,往往是依靠分析者的主观判断进行。因而容易产生结果偏差。因此需要结合其他方法,对数据的正态性指标进行统计描述。
正态性检验分析定量数据是否具有正态分布特质。
操作步骤:选择【正态性检验】分析方法,拖拽分析项到右侧分析框内,点击“开始正态性检验”即可得到结果。
如果样本量大于50,则应该使用Kolmogorov-Smirnov检验结果,反之则使用Shapro-Wilk检验的结果。
上图中,样本量为300,因而选择K-S检验。P值=0.149>0.05,说明数据服从正态分布。
描述法即通过描述数据偏度和峰度系数检验数据的正态性。
偏度和峰度可通过描述性分析得到,也可在正态性检验中直接查看。
理论上讲,标准正态分布偏度和峰度均为0,但现实中数据无法满足标准正态分布,因而如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。
检验数据正态性的方法有很多,其中统计检验法对于数据的要求最为严格,而实际数据由于样本不足等原因,即使数据总体正态但统计检验出来也显示非正态,实用性上不如图示法直观,接受程度高,因此一般情况下使用图示法相对较多。
当正态图和正态性检验结果出现矛盾,如正态图显示数据分布对称而正态性检验结果P<0.05,此时建议不要追求绝对的正态,如数据基本满足正态性即可接受服从正态分布。
另外,正态性检验要求严格通常无法满足,如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。
若想将非正态性数据转化为正态性数据,可将数据取对数、开根号等处理,以接近正态性。
更多干货内容欢迎登陆 SPSSAU官网 阅读
‘叁’ 符合正态分布用什么检验方法
符合正态分布检验的方法如下:
正态分布简介:
正态分布又名高斯分布,是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量服从一个位置参数、尺度参数为的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其期差的开平方或标准差等于尺度参数,决定了分布的幅度。
正态分布的概率密度函数曲线呈钟形,因此人们又经称之为钟形曲线。我们通常所说的标准正态分布是位置参数,尺度参数的正态分布。