导航:首页 > 研究方法 > 因子分析和主成分方法r

因子分析和主成分方法r

发布时间:2022-10-16 15:17:57

A. 试述主成分分析,因子分析和对应分析三者之间的区别与联系

一、方式不同:

1、主成分分析:

通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

2、因子分析:

通过从变量群中提取共性因子,因子分析可在许多变量中找出隐藏的具有代表性的因子。

3、对应分析:

通过分析由定性变量构成的交互汇总表来揭示变量。

二、作用体现不同:

1、主成分分析:

主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用。

2、因子分析:

因子分析在市场调研中有着广泛的应用,主要包括消费者习惯和态度研究、品牌形象和特性研究、服务质量调查、个性测试。

3、对应分析:

能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,是一种直观、简单、方便的多元统计方法。

(1)因子分析和主成分方法r扩展阅读

主成分分析对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

对应分析是由法国人Benzenci于1970年提出的,起初在法国和日本最为流行,然后引入到美国。对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法,因此对应分析又称为R-Q型因子分析。

在因子分析中,如果研究的对象是样品,则需采用Q型因子分析;如果研究的对象是变量,则需采用R型因子分析。但是,这两种分析方法往往是相互对立的,必须分别对样品和变量进行处理。

B. 主成分分析和因子分析是什么

主成分分析和因子分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。

因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名,更容易解释因子的含义。如果研究关注于指标与分析项的对应关系上,或是希望将得到的指标进行命名,SPSSAU建议使用因子分析。

主成分分析目的在于信息浓缩(但不太关注主成分与分析项对应关系),权重计算,以及综合得分计算。如希望进行排名比较,计算综合竞争力,可使用主成分分析。

SPSSAU可直接使用这两种方法,支持自动保存因子得分及综合得分,不需要手动计算。

用F1的分量作为系数,用标准化变量Z1,Zk作为新变量建立线性组合F1,称为第1主成份。用F2的分量作为系数,用标准比变量Z1,Zk作为新变量,建立线性组合后,称为第2主成份。由此可见,主成份F1、F2都是综合性指标。

将数据标准化的数值代入建立的线性组合F1、F2中,就可得出第1主成份和第2主成份的得分,并以此得分高低来排出名次,从而对所研究的问题作出分析评价。

C. 因子分析法和主成分分析法的区别与联系

主成分分析和因子分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。

SPSSAU可直接保存因子得分及综合得分,不需要手动计算。

D. 主成分分析和因子分析是什么

主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。

主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。

主成分分析和因子分析的不同:

1、原理不同:

主成分分析是利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,使得主成分比原始变量具有某些更优越的性能,从而达到简化系统结构,抓住问题实质的目的。

而因子分析更倾向于从数据出发,描述原始变量的相关关系,是由研究原始变量相关矩阵内部的依赖关系出发,把错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。

2、线性表示方向不同:

主成分分析中是把主成分表示成各变量的线性组合,而因子分析是把变量表示成各公因子的线性组合。

3、假设条件不同:

主成分分析不需要有假设条件;而因子分析需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关。

E. 因子分析法和主成分分析法的区别与联系是什么

联系:因子分析法和主成分分析法都是统计分析方法,都要对变量标准化,并找出相关矩阵。区别:在主成分分析中,最终确定的新变量是原始变量的线性组合,因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系。
1.因子分析法通过正交变换,将一组可能具有相关性的变量转换为一组线性不相关的变量,称为主成分。它主要用于市场研究领域。在市场研究中,研究人员关注一些研究指标的整合或组合。这些概念通常通过分数来衡量。人口学、数量地理学、分子动力学模拟、数学建模、数学分析等学科。因子分析和主成分分析都是统计分析方法,都需要对变量进行标准化,找出相关矩阵。
2.因子分析可以在许多变量中发现隐藏的代表性因素。主成分分析的原理是尝试将原始变量重新组合成一组新的独立综合变量。因子分析在主成分分析的基础上增加了一个旋转函数。这种轮换的目的是更容易地命名和解释因素的含义。如果研究的重点是指标与分析项目之间的对应关系,或者想要对得到的指标进行命名,建议使用因子分析。
3.主成分分析法是根据实际需要,尽量选取尽可能少的求和变量,以反映原始变量的信息。这种统计方法称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析试图用一套新的不相关的综合指标取代原有指标。因子分析是社会研究的有力工具,但它不能确定一项研究中有多少因素。当研究中选择的变量发生变化时,因素的数量也会发生变化。
拓展资料:霍特林将这种方法推广到随机向量的情况。信息的大小通常由方差或方差的平方和来衡量。因子分析最早由英国心理学家C.E.斯皮尔曼提出。他发现学生在不同科目的成绩之间有一定的相关性。一门学科成绩好的学生往往在其他学科成绩更好,因此他推测是否有一些潜在的共同因素或一些一般的智力条件影响学生的学业成绩。

F. 主成份分析和因子分析分别是什么

主成分分析和因子分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。

因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名,更容易解释因子的含义。如果研究关注于指标与分析项的对应关系上,或是希望将得到的指标进行命名,SPSSAU建议使用因子分析。

主成分分析目的在于信息浓缩(但不太关注主成分与分析项对应关系),权重计算,以及综合得分计算。如希望进行排名比较,计算综合竞争力,可使用主成分分析。

SPSSAU可直接使用这两种方法,支持自动保存因子得分及综合得分,不需要手动计算。

(6)因子分析和主成分方法r扩展阅读:

用F1的分量作为系数,用标准化变量Z1,…Zk作为新变量建立线性组合F1,称为第1主成份。用F2的分量作为系数,用标准比变量Z1,…Zk作为新变量,建立线性组合后,称为第2主成份。由此可见,主成份F1、F2都是综合性指标。

将数据标准化的数值代入建立的线性组合F1、F2中,就可得出第1主成份和第2主成份的得分,并以此得分高低来排出名次,从而对所研究的问题作出分析评价。

G. 主成分分析和因子分析是什么

主成分分析和因子分析是原理不同,线性表示方向不同,假设条件不同,求解方法不同,主成分和因子的变化不同,因子数量与主成分的数量,解释重点不同,算法上的不同,优点不同,应用场景不同。

原理不同主成分分析基本原理,利用降维线性变换的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标主成分,即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能,主成分必须保留原始变量百分之90以上的信息。

从而达到简化系统结构,抓住问题实质的目的,因子分析基本原理,利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。

主成分分析和因子分析的内容

要从数据中提取对变量起解释作用的少数公共因子,因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系,线性表示方向不同因子分析是把变量表示成各公因子的线性组合,而主成分分析中则是把主成分表示成各变量的线性组合。

假设条件不同主成分分析,不需要有假设,因子分析,需要一些假设,因子分析的假设包括,各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关,求解方法不同求解主成分的方法,从协方差阵出发协方差阵已知,从相关阵出发相关阵R已知,采用的方法只有主成分法。

H. 因子分析和主成分分析有什么区别啊

主成分分析和因子分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。

因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名,更容易解释因子的含义。如果研究关注于指标与分析项的对应关系上,或是希望将得到的指标进行命名,SPSSAU建议使用因子分析。

主成分分析目的在于信息浓缩(但不太关注主成分与分析项对应关系),权重计算,以及综合得分计算。如希望进行排名比较,计算综合竞争力,可使用主成分分析。

SPSSAU可直接使用这两种方法,支持自动保存因子得分及综合得分,不需要手动计算。

I. 《R语言实战》自学笔记71-主成分和因子分析

主成分分析
主成分分析((Principal Component Analysis,PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分(原来变量的线性组合)。整体思想就是化繁为简,抓住问题关键,也就是降维思想。
主成分分析法是通过恰当的数学变换,使新变量——主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法。主成分在变差信息量中的比例越大,它在综合评价中的作用就越大。

因子分析
探索性因子分析法(Exploratory Factor Analysis,EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关系。

PCA与EFA模型间的区别
参见图14-1。主成分(PC1和PC2)是观测变量(X1到X5)的线性组合。形成线性组合的权重都是通过最大化各主成分所解释的方差来获得,同时还要保证个主成分间不相关。相反,因子(F1和F2)被当做是观测变量的结构基础或“原因”,而不是它们的线性组合。

R的基础安装包提供了PCA和EFA的函数,分别为princomp()和factanal()。
最常见的分析步骤
(1)数据预处理。PCA和EFA都根据观测变量间的相关性来推导结果。用户可以输入原始数据矩阵或者相关系数矩阵到principal()和fa()函数中。若输入初始数据,相关系数矩阵将会被自动计算,在计算前请确保数据中没有缺失值。
(2)选择因子模型。判断是PCA(数据降维)还是EFA(发现潜在结构)更符合你的研究目标。如果选择EFA方法,你还需要选择一种估计因子模型的方法(如最大似然估计)。
(3)判断要选择的主成分/因子数目。
(4)选择主成分/因子。
(5)旋转主成分/因子。
(6)解释结果。
(7)计算主成分或因子得分。

PCA的目标是用一组较少的不相关变量代替大量相关变量,同时尽可能保留初始变量的信息,这些推导所得的变量称为主成分,它们是观测变量的线性组合。如第一主成分为:

它是k个观测变量的加权组合,对初始变量集的方差解释性最大。第二主成分也是初始变量的线性组合,对方差的解释性排第二,同时与第一主成分正交(不相关)。后面每一个主成分都最大化它对方差的解释程度,同时与之前所有的主成分都正交。理论上来说,你可以选取与变量数相同的主成分,但从实用的角度来看,我们都希望能用较少的主成分来近似全变量集。

主成分与原始变量之间的关系
(1)主成分保留了原始变量绝大多数信息。
(2)主成分的个数大大少于原始变量的数目。
(3)各个主成分之间互不相关。
(4)每个主成分都是原始变量的线性组合。

数据集USJudgeRatings包含了律师对美国高等法院法官的评分。数据框包含43个观测,12个变量。

用来判断PCA中需要多少个主成分的准则:
根据先验经验和理论知识判断主成分数;
根据要解释变量方差的积累值的阈值来判断需要的主成分数;
通过检查变量间k × k的相关系数矩阵来判断保留的主成分数。
最常见的是基于特征值的方法。每个主成分都与相关系数矩阵的特征值相关联,第一主成分与最大的特征值相关联,第二主成分与第二大的特征值相关联,依此类推。
Kaiser-Harris准则建议保留特征值大于1的主成分,特征值小于1的成分所解释的方差比包含在单个变量中的方差更少。Cattell碎石检验则绘制了特征值与主成分数的图形。这类图形可以清晰地展示图形弯曲状况,在图形变化最大处之上的主成分都可保留。最后,你还可以进行模拟,依据与初始矩阵相同大小的随机数据矩阵来判断要提取的特征值。若基于真实数据的某个特征值大于一组随机数据矩阵相应的平均特征值,那么该主成分可以保留。该方法称作平行分析。

图形解读:线段和x符号组成的图(蓝色线):特征值曲线;
红色虚线:根据100个随机数据矩阵推导出来的平均特征值曲线;
绿色实线:特征值准则线(即:y=1的水平线)
判别标准:特征值大于平均特征值,且大于y=1的特征值准则线,被认为是可保留的主成分。根据判别标准,保留1个主成分即可。

fa.parallel函数学习
fa.parallel(data,n.obs=,fa=”pc”/”both”,n.iter=100,show.legend=T/F)
data:原始数据数据框;
n.obs:当data是相关系数矩阵时,给出原始数据(非原始变量)个数,data是原始数据矩阵时忽略此参数;
fa:“pc”为仅计算主成分,“fa”为因子分析,“both”为计算主成分及因子;
n.iter:模拟平行分析次数;
show.legend:显示图例。

principal(r, nfactors = , rotate = , scores = )

r:相关系数矩阵或原始数据矩阵;
nfactors:设定主成分数(默认为1);
rotate:指定旋转的方法,默认最大方差旋转(varimax)。
scores:设定是否需要计算主成分得分(默认不需要)。

PC1栏包含了成分载荷,指观测变量与主成分的相关系数。如果提取不止一个主成分,那么还将会有PC2、PC3等栏。成分载荷(component loadings)可用来解释主成分的含义,解释主成分与各变量的相关程度。
h2栏为成分公因子方差,即主成分对每个变量的方差解释度。
u2栏为成分唯一性,即方差无法被主成分解释的部分(1-h2)。
SS loadings包含了与主成分相关联的特征值,其含义是与特定主成分相关联的标准化后的方差值,即可以通过它来看90%的方差可以被多少个成分解释,从而选出主成分(即可使用nfactors=原始变量个数来把所有特征值查出,当然也可以直接通过eigen函数对它的相关矩阵进行查特征值)。
Proportion Var表示每个主成分对整个数据集的解释程度。
Cumulative Var表示各主成分解释程度之和。
Proportion Explained及Cumulative Proportion分别为按现有总解释方差百分比划分主成分及其累积百分比。

结果解读:第一主成分(PC1)与每个变量都高度相关,也就是说,它是一个可用来进行一般性评价的维度。ORAL变量99.1%的方差都可以被PC1来解释,仅仅有0.91%的方差不能被PC1解释。第一主成分解释了11个变量92%的方差。

结果解读:通过碎石图可以判定选择的主成分个数为2个。

结果解读:从结果Proportion Var: 0.58和0.22可以判定,第一主成分解释了身体测量指标58%的方差,而第二主成分解释了22%,两者总共解释了81%的方差。对于高度变量,两者则共解释了其88%的方差。

旋转是一系列将成分载荷阵变得更容易解释的数学方法,它们尽可能地对成分去噪。旋转方法有两种:使选择的成分保持不相关(正交旋转),和让它们变得相关(斜交旋转)。旋转方法也会依据去噪定义的不同而不同。最流行的正交旋转是方差极大旋转,它试图对载荷阵的列进行去噪,使得每个成分只是由一组有限的变量来解释(即载荷阵每列只有少数几个很大的载荷,其他都是很小的载荷)。 结果列表中列的名字都从PC变成了RC,以表示成分被旋转。

当scores = TRUE时,主成分得分存储在principal()函数返回对象的scores元素中。

如果你的目标是寻求可解释观测变量的潜在隐含变量,可使用因子分析。
EFA的目标是通过发掘隐藏在数据下的一组较少的、更为基本的无法观测的变量,来解释一
组可观测变量的相关性。这些虚拟的、无法观测的变量称作因子。(每个因子被认为可解释多个
观测变量间共有的方差,因此准确来说,它们应该称作公共因子。)

其中 是第i个可观测变量(i = 1…k), 是公共因子(j = 1…p),并且p<k。 是 变量独有的部分(无法被公共因子解释)。 可认为是每个因子对复合而成的可观测变量的贡献值。

碎石检验的前两个特征值(三角形)都在拐角处之上,并且大于基于100次模拟数据矩阵的特征值均值。对于EFA,Kaiser-Harris准则的特征值数大于0,而不是1。
结果解读:PCA结果建议提取一个或者两个成分,EFA建议提取两个因子。

fa(r, nfactors=, n.obs=, rotate=, scores=, fm=)
 r是相关系数矩阵或者原始数据矩阵;
 nfactors设定提取的因子数(默认为1);
 n.obs是观测数(输入相关系数矩阵时需要填写);
 rotate设定旋转的方法(默认互变异数最小法);
 scores设定是否计算因子得分(默认不计算);
 fm设定因子化方法(默认极小残差法)。
与PCA不同,提取公共因子的方法很多,包括最大似然法(ml)、主轴迭代法(pa)、加权最小二乘法(wls)、广义加权最小二乘法(gls)和最小残差法(minres)。统计学家青睐使用最大似然法,因为它有良好的统计性质。

结果解读:两个因子的Proportion Var分别为0.46和0.14,两个因子解释了六个心理学测试60%的方差。

结果解读:阅读和词汇在第一因子上载荷较大,画图、积木图案和迷宫在第二因子上载荷较大,非语言的普通智力测量在两个因子上载荷较为平均,这表明存在一个语言智力因子和一个非语言智力因子。

正交旋转和斜交旋转的不同之处。
对于正交旋转,因子分析的重点在于因子结构矩阵(变量与因子的相关系数),而对于斜交旋转,因子分析会考虑三个矩阵:因子结构矩阵、因子模式矩阵和因子关联矩阵。
因子模式矩阵即标准化的回归系数矩阵。它列出了因子预测变量的权重。因子关联矩阵即因子相关系数矩阵。

图形解读:词汇和阅读在第一个因子(PA1)上载荷较大,而积木图案、画图和迷宫在第二个因子(PA2)上载荷较大。普通智力测验在两个因子上较为平均。

与可精确计算的主成分得分不同,因子得分只是估计得到的。它的估计方法有多种,fa()函数使用的是回归方法。

R包含了其他许多对因子分析非常有用的软件包。FactoMineR包不仅提供了PCA和EFA方法,还包含潜变量模型。它有许多此处我们并没考虑的参数选项,比如数值型变量和类别型变量的使用方法。FAiR包使用遗传算法来估计因子分析模型,它增强了模型参数估计能力,能够处理不等式的约束条件,GPArotation包则提供了许多因子旋转方法。最后,还有nFactors包,它提供了用来判断因子数目的许多复杂方法。

主成分分析

1.数据导入
数据结构:对10株玉米进行了生物学性状考察,考察指标有株高,穗位,茎粗,穗长,秃顶,穗粗,穗行数,行粒数。

结果解读:选择2个主成分即可保留样本大量信息。

3.提取主成分

结果解读:主成分1可解释44%的方差,主成分2解释了26%的方差,合计解释了70%的方差。

4.获取主成分得分

5.主成分方程

PC1 = 0.27 株高 - 0.04 穗位 + 0.29 茎粗 - 0.01 穗长 - 0.21 秃顶 - 0.13 穗粗 + 0.16 穗行数 + 0.24 行粒数

PC2 = -0.01 株高 + 0.36 穗位 - 0.10 茎粗 + 0.41 穗长 - 0.08 秃顶 + 0.43 穗粗 - 0.15 穗行数 + 0.01 行粒数

图形解读:此图反映了变量与主成分的关系,三个蓝点对应的RC2值较高,点上的标号2,4,6对应变量名穗位,穗长,穗粗,说明第2主成分主要解释了这些变量,与这些变量相关性强;黑点分别对应株高,茎粗,穗行数,行粒数,说明第一主成分与这些变量相关性强,第一主成分主要解释的也是这些变量,而5号点秃顶对于两个主成分均没有显示好的相关性。

因子分析

图解:可以看到需要提取4个因子。

2.提取因子

结果解读:因子1到4解释了80%的方差。

3.获取因子得分

图解:可以看出,因子1和因子2的相关系数为0.4,行粒数,株高,茎粗,秃顶在因子1的载荷较大,穗长,穗位在因子2上的载荷较大;因子3只有穗行数相关,因子4只有穗粗相关。

参考资料:

J. 主成分分析法与因子分析法的区别

一、性质不同

1、主成分分析法性质:通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量。

2、因子分析法性质:研究从变量群中提取共性因子的统计技术。

二、应用不同

1、主成分分析法应用:比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。

2、因子分析法应用:

(1)消费者习惯和态度研究(U&A)

(2) 品牌形象和特性研究

(3)服务质量调查

(4) 个性测试

(5)形象调查

(6) 市场划分识别

(7)顾客、产品和行为分类



(10)因子分析和主成分方法r扩展阅读:

主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时,根据实际需要,尽量少取几个求和变量,以反映原始变量的信息。

这种统计方法被称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析(PCA)是试图用一组新的不相关的综合指标来代替原来的指标。

因子分析为社会研究的一种有力工具,但不能确定一项研究中有几个因子。当研究中选择的变量发生变化时,因素的数量也会发生变化。此外,对每个因素的实际含义的解释也不是绝对的。

阅读全文

与因子分析和主成分方法r相关的资料

热点内容
故事启发的教学方法 浏览:574
都有哪些种植的方法 浏览:549
企业分析法是选股的方法吗 浏览:110
Wto分析方法内容 浏览:745
图解题的方法和步骤 浏览:404
破壁孢子粉的鉴别方法 浏览:254
腘伸肌锻炼方法 浏览:391
婴儿拉肚子的鉴别方法 浏览:260
如何培养正气的方法 浏览:564
oppo的ip地址在哪里设置方法 浏览:882
思维方法特点是什么 浏览:9
简单万用表使用方法完整视频教程 浏览:863
儿童痣治疗方法 浏览:489
研究方法调查问卷教学 浏览:401
fema安全分析方法 浏览:307
孩子快速入睡的方法 浏览:799
搜派风水机使用方法 浏览:697
猪肉价格下跌的解决方法 浏览:938
泉州学唱歌技巧和发声方法 浏览:966
神经源性膀胱工伤治疗方法 浏览:969