导航:首页 > 研究方法 > 多元统计分析设计方法

多元统计分析设计方法

发布时间:2022-09-28 13:00:34

⑴ 常用的多元分析方法

多元分析方法包括3类:

多元方差分析、多元回归分析和协方差分析,称为线性模型方法,用以研究确定的自变量与因变量之间的关系;判别函数分析和聚类分析,用以研究对事物的分类;主成分分析、典型相关和因素分析,研究如何用较少的综合因素代替为数较多的原始变量。

多元方差是把总变异按照其来源分为多个部分,从而检验各个因素对因变量的影响以及各因素间交互作用的统计方法。

判别函数是判定个体所属类别的统计方法。其基本原理是:根据两个或多个已知类别的样本观测资料确定一个或几个线性判别函数和判别指标,然后用该判别函数依据判别指标来判定另一个个体属于哪一类。

(1)多元统计分析设计方法扩展阅读

多元分析方法的历史:

首先涉足多元分析方法是F.高尔顿,他于1889年把双变量的正态分布方法运用于传统的统计学,创立了相关系数和线性回归。

其后的几十年中,斯皮尔曼提出因素分析法,费希尔提出方差分析和判别分析,威尔克斯发展了多元方差分析,霍特林确定了主成分分析和典型相关。到20世纪前半叶,多元分析理论大多已经确立。

60年代以后,随着计算机科学的发展,多元分析方法在心理学以及其他许多学科的研究中得到了越来越广泛的应用。

⑵ SPSS统计分析高级教程的目录

第一部分一般线性与混合线性模型.
第1章方差分析模型
1.1模型简介
1.1.1模型入门
1.1.2常用术语
1.1.3方差分析模型的适用条件
1.2简单分析实例
1.2.1模型表达式
1.2.2初步分析结果
1.2.3模型参数的估计值
1.2.4两两比较
1.2.5其他常用选项
1.3两因素方差分析模型
1.3.1分析实例
1.3.2边际均数与轮廓图
1.3.3拟和劣度检验
1.4因素各水平间的精细比较
1.4.1POSTHOC子句
1.4.2EMMEANS子句
1.4.3LMATRIX和KMATRIX子句
1.4.4CONSTRAST子句
1.5随机因素的方差分析模型
1.6其他问题
1.6.1自定义效应检验使用的误差项
1.6.2四类方差分解方法
第2章常用实验设计分析方法
2.1仅研究主效应的实验设计方案
2.1.1完全随机设计(CompletelyRandomDesign)
2.1.2配伍组设计(RandomizedBlockDesign)
2.1.3交叉设计(Cross-overDesign)
2.1.4拉丁方设计(LatinSquareDesign)
2.2考虑交互作用的实验设计方案
2.2.1析因设计(FactorialDesign)
2.2.2正交设计(OrthogonalDesign)
2.2.3均匀设计(UniformDesign)
2.3误差项变动的特殊实验设计方案
2.3.1嵌套设计(NestedDesign)
2.3.2重复测量设计(RepeatedMeasureDesign)
2.3.3裂区设计(Split-plotDesign)
2.4协方差分析(AnalysisofCovariance)
2.4.1协方差分析的必要性
2.4.2平行性假定的检验
2.4.3计算和检验修正均数
第3章多元方差分析与重复测量方差分析
3.1多元方差分析
3.1.1模型简介
3.2.2分析实例
3.3.3检验统计量的计算
3.3.4对引例的进一步分析
3.2重复测量资料的方差分析
3.2.1模型简介
3.2.2分析实例
第4章混合线性模型入门
4.1模型简介
4.1.1问题的提出
4.1.2模型入门
4.2层次聚集性数据分析实例
4.1.1拟合混合线性模型的基本结构
4.1.2在固定效应中加入自变量
4.1.3在随机效应中加入自变量
4.1.4更多解释变量的引入
4.1.5其他常用选项
4.3重复测量数据分析实例
4.3.1对数据的初步分析
4.3.2拟合混合线性模型的基本结构
4.3.3考虑重复测量间的相关性
4.3.4更改对测量间相关性的假定
4.3.5模型中可用的相关阵种类
4.4本章方法小结
4.4.1混合效应模型的用途
4.4.2混合效应模型与一般线性模型的联系
第二部分回归模型
第5章多重线性回归模型
5.1模型简介
5.2简单分析实例
5.2.1对数据的初步分析
5.2.2回归模型的假设检验
5.2.3偏回归系数的假设检验
5.2.4标准化偏回归系数
5.2.5衡量多元线性回归模型优劣的标准
5.3回归预测与残差分析
5.3.1回归预测与区间估计
5.3.2残差分析与模型适用条件的检验
5.4逐步回归
5.4.1筛选自变量的基本原则
5.4.2常用的逐步回归方法
5.4.3分析实例
5.5模型的进一步诊断与修正
5.5.1强影响点的识别与处理
5.5.2多重共线性的识别与处理
5.6本章方法小结
5.6.1回归模型的建立步骤
5.6.2多重线性回归模型结果解释时应注意的问题
第6章线性回归的衍生模型
6.1非直线趋势的处理:曲线直线化
6.1.1方法简介
6.1.2使用Linear过程进行分析
6.1.3使用曲线拟合过程分析
6.2方差不齐的处理:加权最小二乘法
6.2.1方法简介
6.2.2使用Linear过程进行分析
6.2.3使用WLS过程分析
6.3共线性的处理:岭回归
6.3.1方法简介
6.3.2分析实例
6.4分类变量的数值化:最优尺度回归
6.4.1方法简介
6.4.2分析实例
6.4.3最优尺度方法的应用注意事项
第7章路径分析入门
7.1两阶段最小二乘法
7.1.1模型简介
7.1.2使用Linear过程进行分析
7.1.3使用2SLS过程进行分析
7.2路径分析入门
7.2.1模型简介
7.2.2分析实例
第8章非线性回归模型
8.1模型简介
8.1.1问题的提出
8.1.2模型入门
8.2简单分析实例
8.2.1软件操作与界面说明
8.2.2基本分析结果
8.2.3模型的进一步分析
8.3自定义损失函数:最小一乘法实例
8.3.1分析实例
8.3.3结果解释
8.4分段回归模型的拟合
8.4.1分析实例
8.4.2结果解释
8.4.3模型的进一步分析
8.5其他需要注意的问题
8.5.1参数初始值的设定
8.5.2模型的拟合方法
第9章二分类logistic回归模型
9.1模型简介
9.1.1模型入门
9.1.2一些基本概念
9.2简单分析实例
9.3分类自变量的定义与比较方法
9.3.1使用哑变量的必要性
9.3.2SPSS中预设的哑变量编码方式
9.3.3设置哑变量时要注意的问题
9.4自变量的筛选方法与逐步回归
9.4.1模型中的假设检验方法
9.4.2自变量的筛选方法
9.4.3分析实例
9.5模型拟合效果与拟合优度检验
9.5.1模型效果的判断指标
9.5.2拟合优度检验
9.6模型的诊断与修正
9.6.1残差分析
9.6.2多重共线性的识别及其对回归系数的影响及处理办法
第10章多分类.配对logistic回归与probit回归
10.1有序多分类logistic回归模型
10.1.1模型简介
10.1.2分析实例
10.1.3模型适用条件的检验
10.2无序多分类logistic回归模型
10.2.1模型简介
10.2.2分析实例
10.31:1配对logistic回归
10.3.1模型简介
10.3.2分析实例
10.4probit回归模型
10.4.1模型简介
10.4.2实例一:与logistic模型比较
10.4.3实例二:计算LD50
第三部分多元统计分析方法
第11章主成分分析与因子分析
11.1主成分分析
11.1.1模型入门..
11.1.2简单分析实例
11.1.3对主成分分析的进一步说明
11.2因子分析
11.2.1模型入门
11.2.4简单分析实例
11.3因子分析的进一步讨论
11.3.1不同的因子分析法
11.3.2相关阵和协方差
11.3.3确定公因子数量
11.4因子分析综合案例
11.5主成分分析和因子分析的比较
第12章聚类分析
12.1模型简介
12.1.1问题的提出
12.1.2聚类分析入门
12.1.3聚类分析的方法体系
12.2层次聚类法
12.2.1方法原理
12.2.2分析实例
12.2.3对层次聚类法的进一步讨论
12.3K-均值聚类法
12.3.1方法原理
12.3.2分析实例
12.4两步聚类法简介
12.4.1方法原理
12.4.2分析实例
12.5本章方法小结
第13章判别分析
13.1模型简介
13.1.1典型判别分析的基本原理
13.1.2判别分析的适用条件和违背条件时的处理方法
13.1.3判别效果的评价
13.1.4判别分析的一般步骤
13.2简单分析实例
13.2.1软件操作与界面说明
13.2.2基本分析结果
13.2.3判别结果的图形化展示
13.2.4判别效果的验证
13.2.5适用条件的判断方法
13.3贝叶斯判别分析
13.3.1方法原理
13.3.2软件实现
13.4对判别分析的进一步讨论
13.4.1逐步判别分析
13.4.2判别分析和因子分析的相似性和差异
13.4.3二类判别和多重回归的等价性
第14章典型相关分析
14.1方法介绍
14.1.1典型相关分析的基本思想
14.2.1典型相关分析的数学描述
14.2分析实例
14.2.1两组变量间的相关系数
14.2.2典型相关系数及显着性检验
11.2.3典型变量的系数
14.2.4典型结构分析
14.2.5典型冗余分析
14.3本章方法小结
14.3.1典型相关分析的应用
14.3.2典型相关分析和因子分析
第15章对应分析
15.1模型简介
15.1.1问题的提出
15.1.2模型入门
15.1.3SPSS中的相应功能
15.2简单分析实例
15.2.1对数据的初步分析
15.2.2正式分析
15.2.3对引例的进一步分析
15.3基于均数的对应分析
15.3.1方法原理
15.3.2分析实例
15.4多重对应分析
15.4.1方法原理
15.4.2分析实例
15.5对应分析中的其它问题
15.5.1对应分析结果的正确解释
15.5.2罕见类别和相似类别的处理
15.5.3有序类别的处理
15.6本章方法小结
15.6.1对应分析与其它分析方法的关系
15.6.2对应分析的优势与劣势
第16章多维尺度分析
16.1古典MDS模型
16.1.1方法原理
16.1.2分析实例
16.1.3距离的计算方式
16.2非度量MDS模型
16.2.1数据测量尺度的设定
16.2.2方法原理
16.2.3分析实例
16.3考虑个体差异的MDS模型
16.3.1方法原理
16.3.2分析实例
16.3.3空间定位图的含义解释
16.4基于最优尺度变换的MDS模型
16.4.1方法简介
16.4.2分析实例
16.5本章方法小结
第四部分其他统计分析方法
第17章对数线性模型与Poisson回归
17.1对数线性模型简介
17.1.1问题的提出
17.1.2模型入门
17.1.3SPSS的相应功能
17.2一般对数线性模型分析实例
17.2.1对数据的初步分析
17.2.2正式分析
17.2.3对引例的进一步分析
17.3因果关系明确时的对数线性模型
17.4对数线性模型的选择
17.4.1模型的选择策略
17.4.2分析实例
17.5对数线性模型与其它模型的关系
17.5.1对数线性模型与方差分析模型的关系
17.5.2对数线性模型与Logistic回归的关系
17.6Poisson回归模型
17.6.1模型简介
17.6.2分析实例
第18章信度分析
18.1信度理论入门
18.1.1真分数测量理论
18.1.2信度与效度
18.1.3内在信度与外在信度
18.1.4信度的判断标准
18.2简单分析实例
18.2.1Alpha信度系数
18.2.2对各题目的深入分析
18.2.3对真分数理论假设的考察
18.3其余常用的信度系数
18.3.1重测信度
18.3.2折半信度
18.3.3Guttman系数
18.3.4平行模型的信度系数
18.3.5严格平行模型的信度系数
18.3.6评分者信度
18.3.7信度系数总结
18.4信度理论进阶
18.4.1真分数测量理论的缺限
18.4.2概化理论入门
18.4.3SPSS中相应的分析功能
第19章生存分析
19.1生存分析简介
19.1.1生存分析简史
19.1.2生存分析中的基本概念
19.1.3生存分析的基本步骤
19.1.4SPSS与生存分析
19.2生存函数的估计和检验
19.2.1生存函数的基本估计方法
19.2.2Kaplan-Meier法
19.2.3寿命表法
19.2.4Kaplan-Meier法和寿命表法比较
19.3Cox回归模型
19.3.1Cox模型入门
19.3.2分析实例
19.3.3比例风险性的图形验证
19.4含时间依存性变量的Cox模型
19.4.1时依协变量的种类
19.4.2用时依模型验证比例风险性
19.4.3用时依模型评价处理因素的影响
19.4.4用时依模型评价重复测量因子的影响
19.5关于Cox模型的一些高级话题
19.5.1生存分析中的分层变量
19.5.2用Cox回归过程拟合配伍Logistic回归
19.5.3竞争风险的Cox模型
第20章缺失值分析入门
20.1缺失值理论简介
20.1.1数据的缺失机制
20.1.2SPSS中对缺失值的处理方法
20.2对缺失情况的基本分析
20.2.1缺失值数据的生成
20.2.2对缺失模式的分析
20.2.3缺失情况的统计描述
20.3缺失值填充技术
20.3.1列表输出
20.3.2使用回归算法进行填充
20.3.3使用EM算法进行填充
20.3.4多重填充技术简介
思考与练习
参考文献
附录...

⑶ 求高手指点,做多元统计分析课程设计用因子分析降维为什么只剩一维,可以直接下结论还是哪里出现了错误。

看你的条件设置
1 按方差贡献程度

2 特征值大小

3 自己指定因子数

⑷ 请问谁有关于统计的论文,具体要求是使用多元统计分析方法分析数据,还有如下:

1. 因子分析模型

因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

因子分析的基本思想:
把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子

因子分析模型描述如下:

(1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。

(2)F = (F1,F2,…,Fm)¢ (m<p)是不可测的向量,其均值向量E(F)=0,协方差矩阵Cov(F) =I,即向量的各分量是相互独立的。

(3)e = (e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:

x1 = a11F1+ a12F2 +…+a1mFm + e1

x2 = a21F1+a22F2 +…+a2mFm + e2

………

xp = ap1F1+ ap2F2 +…+apmFm + ep

称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。

其矩阵形式为: x =AF + e .

其中:

x=,A=,F=,e=

这里,

(1)m £ p;

(2)Cov(F,e)=0,即F和e是不相关的;

(3)D(F) = Im ,即F1,F2,…,Fm不相关且方差均为1;

D(e)=,即e1,e2,…,ep不相关,且方差不同。

我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X的特殊因子。

A = (aij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。

2. 模型的统计意义

模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。公共因子的含义,必须结合具体问题的实际意义而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。模型中载荷矩阵A中的元素(aij)是为因子载荷。因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj的程度。可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。

因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度。它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大。

将因子载荷矩阵A的第j列( j =1,2,…,m)的各元素的平方和记为gj2,称为公共因子Fj对x的方差贡献。gj2就表示第j个公共因子Fj对于x的每一分量xi(i= 1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大。如果将因子载荷矩阵A的所有gj2 ( j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。

3. 因子旋转

建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。

旋转的方法有很多,正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有Promax法等。

4.因子得分

因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分。

设公共因子F由变量x表示的线性组合为:

Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m

该式称为因子得分函数,由它来计算每个样品的公共因子得分。若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2,并将其在平面上做因子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究。

但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分的方法较多,常用的有回归估计法,Bartlett估计法,Thomson估计法。

(1)回归估计法

F = X b = X (X ¢X)-1A¢ = XR-1A¢ (这里R为相关阵,且R = X ¢X )。

(2)Bartlett估计法

Bartlett估计因子得分可由最小二乘法或极大似然法导出。

F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X

(3)Thomson估计法

在回归估计法中,实际上是忽略特殊因子的作用,取R = X ¢X,若考虑特殊因子的作用,此时R = X ¢X+W,于是有:

F = XR-1A¢ = X (X ¢X+W)-1A¢

这就是Thomson估计的因子得分,使用矩阵求逆算法(参考线性代数文献)可以将其转换为:

F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢

5. 因子分析的步骤

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

(i)因子分析常常有以下四个基本步骤:

(1)确认待分析的原变量是否适合作因子分析。

(2)构造因子变量。

(3)利用旋转方法使因子变量更具有可解释性。

(4)计算因子变量得分。

(ii)因子分析的计算过程:

(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。

(2)求标准化数据的相关矩阵;

(3)求相关矩阵的特征值和特征向量;

(4)计算方差贡献率与累积方差贡献率;

(5)确定因子:

设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;

(6)因子旋转:

若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。

(7)用原指标的线性组合来求各因子得分:

采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。

(8)综合得分

以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。

F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )

此处wi为旋转前或旋转后因子的方差贡献率。

(9)得分排序:利用综合得分可以得到得分名次。

在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:

· 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。

· 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。

· 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。

如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。
Rotated Component Matrix,就是经转轴后的因子负荷矩阵,
当你设置了因子转轴后,便会产生这结果。
转轴的是要得到清晰的负荷形式,以便研究者进行因子解释及命名。

SPSS的Factor Analysis对话框中,有个Rotation钮,点击便会弹出Rotation对话框,
其中有5种因子旋转方法可选择:

1.最大变异法(Varimax):使负荷量的变异数在因子内最大,亦即,使每个因子上具有最高载荷的变量数最少。

2.四次方最大值法(Quartimax):使负荷量的变异数在变项内最大,亦即,使每个变量中需要解释的因子数最少。

3.相等最大值法(Equamax):综合前两者,使负荷量的变异数在因素内与变项内同时最大。

4.直接斜交转轴法(Direct Oblimin):使因素负荷量的差积(cross-procts)最小化。

5.Promax 转轴法:将直交转轴(varimax)的结果再进行有相关的斜交转轴。因子负荷量取2,4,6次方以产生接近0但不为0的值,借以找出因子间的相关,但仍保有最简化因素的特性。

上述前三者属于“直交(正交)转轴法”(Orthogonal Rotations),在直交转轴法中,因子与因子之间没有相关,因子轴之间的夹角等于90 度。后两者属于“斜交转轴”(oblique rotations),表示因子与因子之间彼此有某种程度的相关,因素轴之间的夹角不是90度。

直交转轴法的优点是因子之间提供的讯息不会重叠,受访者在某一个因子的分數与在其他因子的分數,彼此独立互不相关;缺点是研究迫使因素之间不相关,但这种情况在实际的情境中往往并不常存在。至于使用何种转轴方式,须视乎研究题材、研究目的及相关理论,由研究者自行设定。

在根据结果解释因子时,除了要看因子负荷矩阵中,因子对哪些变量呈高负荷,对哪些变量呈低负荷,还须留意之前所用的转轴法代表的意义。

2,主成分分析(principal component analysis)

将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
(1)主成分分析的原理及基本思想。
原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。
基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
(2)步骤
Fp=a1mZX1+a2mZX2+……+apmZXp
其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵∑的特征值多对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化]。
A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0 。
进行主成分分析主要步骤如下:
1. 指标数据标准化(SPSS软件自动执行);
2. 指标之间的相关性判定;
3. 确定主成分个数m;
4. 主成分Fi表达式;
5. 主成分Fi命名;

选用以上两种方法时的注意事项如下:
1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。

5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。

总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(rece dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。

(1)了解如何通过SPSS因子分析得出主成分分析结果。首先,选择SPSS中Analyze-Data Rection-Factor…,在Extraction…对话框中选择主成分方法提取因子,选择好因子提取个数标准后点确定完成因子分析。打开输出结果窗口后找到Total Variance Explained表和Component Matrix表。将Component Matrix表中第一列数据分别除以Total Variance Explained表中第一特征根值的开方得到第一主成分表达式系数,用类似方法得到其它主成分表达式。打开数据窗口,点击菜单项的Analyze-Descriptive Statistics-Descriptives…,在打开的新窗口下方构选Save standardized values as variables,选定左边要分析的变量。点击Options,只构选Means,点确定后既得待分析变量的标准化新变量。

选择菜单项Transform-Compute…,在Target Variable中输入:Z1(主成分变量名,可以自己定义),在Numeric Expression中输入例如:0.412(刚才主成分表达式中的系数)*Z人口数(标准化过的新变量名)+0.212*Z第一产业产值+…,点确定即得到主成分得分。通过对主成分得分的排序即可进行各个个案的综合评价。很显然,这里的过程分为四个步骤:

Ⅰ.选主成分方法提取因子进行因子分析。

Ⅱ.计算主成分表达式系数。

Ⅲ.标准化数据。

Ⅳ.计算主成分得分。

我们的程序也将依该思路展开开发。

(2)对为何要将Component Matrix表数据除以特征根开方的解释

我们学过主成分分析和因子分析后不难发现,原来因子分析时的因子载荷矩阵就是主成分分析特征向量矩阵乘以对应特征根开方值的对角阵。而Component Matrix表输出的恰是因子载荷矩阵,所以求主成分特征向量自然是上面描述的逆运算。

成功启动程序后选定分析变量和主成分提取方法即可在数据窗口输出得分和在OUTPUT窗口输出主成分表达式。

3,聚类分析(Cluster Analysis)

聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术 。

在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作。

4.判别分析(Discriminatory Analysis)

判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。

费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。

距离判别思想是根据各样品与各母体之间的距离远近作出判别。即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各母体之间的距离值,判样品属于距离值最小的那个母体。

5.对应分析(Correspondence Analysis)

对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。

运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。

这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息。

⑸ 多元统计分析与统计分析的区别是什么差不多吗

多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和对个指标互相关联的情况下分析它们的统计规律,很适合农业科学研究的特点。主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。简称多元分析。当总体的分布是多维(多元)概率分布时,处理该总体的数理统计理论和方法。数理统计学中的一个重要的分支学科
统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。它又是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。系统、完善的资料是统计分析的必要条件

⑹ 多元统计分析方法的作用是什么

多元统计分析方法的作用使实际工作者利用多元统计分析方法解决实际问题更简单方便。

如果每个个体有多个观测数据,或者从数学上说,如果个体的观测数据能表为P维欧几里得空间的点,那么这样的数据叫做多元数据,而分析多元数据的统计方法就叫做多元统计分析,它是数理统计学中的一个重要的分支学科。

典型相关分析

它是寻求两组变量各自的线性函数中相关系数达到最大值的一对,这称为第一对典型变量,还可以求第二对,第三对,等等,这些成对的变量,彼此是不相关的。各对的相关系数称为典型相关系数。通过这些典型变量所代表的实际含意,可以找到这两组变量间的一些内在联系。典型相关分析虽然30年代已经出现,但至今未能广泛应用。

阅读全文

与多元统计分析设计方法相关的资料

热点内容
胸上缝的训练方法 浏览:105
太原公交乘车码使用方法 浏览:944
三星手机拨号快捷键怎么设置在哪里设置方法 浏览:528
如何辨别钻石好坏的方法 浏览:431
hdlc检测方法 浏览:670
水培石斛兰的种植方法 浏览:426
干式变压器项目研究试验方法 浏览:386
青春期偏头疼的原因和解决方法 浏览:66
瓷砖成型缺陷解决方法 浏览:392
一岁半亚麻籽油的食用方法 浏览:28
虫害处理方法哪里找 浏览:416
决战平安京有哪些方法登录 浏览:578
小腿划伤怎么处理方法 浏览:478
如何测量磷酸盐的方法 浏览:976
平稳序列检测方法 浏览:919
不打针治疗咳嗽的方法 浏览:280
毛利润30利润计算方法 浏览:4
后束三角肌的锻炼方法 浏览:56
游戏流量包使用方法 浏览:934
木工做酒格的计算方法 浏览:219