① 正态分布问题
1.是否符合正态分布的基本规律为:
几乎与社会相关的大多是偏态分布,比如一定时间一定空间里的人、车的流量;人口增长与消亡的分布。
几乎与自然相关的大多是近似的正态分布,比如人或动物的身高分布,体重分布。在天文、生态、医学等等;
但数据是否符合正态分布并不能作为判定其真实性的依据。
误差项服从正态分布是最小二乘估计为最优无偏线性假定的前提条件,
许多非正态分布可转化为近似正态分布:
◆ 取对数
◆ 正态化处理方法
◆ 利用大样本性质(t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理)
2.我们单位的数据难以通过数据分析判定上报的数据是否真实,
只能能利用除异常值检验等做基本判断;
但态度、意见式问卷可做信度分析:
包括Cronbach′ 系数,折半信度(半分),Guttman系数判定。
② 如何标准化正态分布的数据
正态分布标准化的公式:Y=(X-μ)/σ~N(0,1)。
标准正态分布 是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。
正态分布的定义
标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。
标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。
③ 如何使数据正态化
首先,可以对数据进行正态化转化,然后对转化之后的数据进行相关统计。这样的正态化过程是非线性转化的过程,事实上已经改变了原始数据的分布形态,所以,结果的准确性会降低,在推论时应该非常谨慎。数据正态化的方法有多种,经常采用的是将原始分求平方根、对数或者倒数,然后再对转化好的数据进行正态性检验。 其次,如果你不想进行正态化转化,对于上述数据,还可以采用非参数检验。只不过,原本连续的数据只能降低为等级数据或者计数数据来使用了。
④ 如何将一组非正态分布的数据正态化
在确认数据样本来自于非正态分布后,对数据作变换后若分布近似于钟形曲线,则可以认为变换后的数据来自一正态总体。
常用的变换有:y=lnx,y=x^-1,y=x^2,y=x^1/2
如果使用MINTAB软件,可在拟合检验是看那种转换模式的P值最大,然后就使用哪种转换。
⑤ 如何将非正态分布转化为正态分布
设非标准正态分布X~N(μ,σ^2),则关于X的一个一次函数 (X-μ)/σ ,就一定是服从标准正态分布N(0,1)。例如:一个量X,是非标准正态分布,期望是10,方差是5^2(即X~N(10,5^2));那么对于X的线性函数Y=(X-10)/5,Y就是服从标准正态分布的Y~N(0,1)。
标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。
(5)正态化处理方法有哪些扩展阅读:
标准正态分布的特点:
1、密度函数关于平均值对称
2、平均值与它的众数(statistical mode)以及中位数(median)同一数值。
3、函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。
4、函数曲线的反曲点(inflection point)为离平均数一个标准差距离的位置。
⑥ 如何用SPSS做数据正态化转换
将非正态分布的数据转化为正态可以通过以下方式处理:
spss工具栏:transform-Rank cases,将左边你要进行正态化的变量拖入右边“变量”框中;点选rank types对话窗,选中normal scores选项(共四种计算方法,系统默认的是bloom计算方法,可根据你的需要进行改进),点击continue,ok,此时spss页面上会生成两列新变量,第一个变量,N打头的那个就是正态化后的新变量
要注意的一点是不是任何非正态数据都可以进行正态转换,只有我们有把握认为数据的总体分布是正态的时候才可以去做正态转换,否则强行进行z或者t检验得到的结果未必是正确的。
⑦ SPSS非正态分布数据如何修改成为正态分布数据!急求
可以应用变量变换的方法,将不服从正态分布的资料转化为非正态分布或近似正态分布。
常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正玄变换等,应根据资料性质选择适当的变量变换方法。
X’=lgX当原始数据中有小值及零时,亦可取X’=lg(X+1)还可根据需要选用X’=lg(X+k)或X’=lg(k-X)对数变换常用于(1)使服从对数正态分布的数据正态化。如环境中某些污染物的分布,人体中某微量元素的分布等,可用对数正态分布改善其正态性。
图形特征
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。
以上内容参考:网络-正态分布
⑧ SPSS中怎样把数据正态化
我用的是spss18.0,这是个汉化版,将一组数据正态化的按纽分别是:“转换”——“个案排秩”——把要正态化的数据迁入“变量”栏——把要呈现的表格式样迁入“排序标准”——再点右上角“秩的类型”——再点右下角“正态得分”,基本上就差不多了,只是正态化有四个选择项,我用的是tukey法,这种方法对负偏态比较严重的分数相当好。