导航:首页 > 知识科普 > 计算因子得分的方法有哪些

计算因子得分的方法有哪些

发布时间:2022-12-19 09:29:26

① 16种常用的数据分析方法-因子分析


因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。 


是一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法




基本思想


根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构一即公共因子。




什么做因子分析


举例说明:在实际门店问题中,往往我们会选择潜力最大的门店作为领航店,以此为样板,实现业绩和利润的突破及未来新店的标杆。选择领航店过程中我们要注重很多因素,比如:


↘所在小区的房价

↘总面积

↘户主年龄分布

↘小区户数

↘门店面积

↘2公里范围内竞争门店数量等


收集到所有的这些数据虽然能够全面、精准的确定领航店的入选标准,但实际建模时这些变量未必能够发挥出预期的作用。主要体现两方面:计算量的问题;变量间的相关性问题。


这时,最简单直接的方案就是削减变量个数,确定主要变量,因子分析以最少的信息丢失为前提,将众多的原有变量综合成少数的综合指标。




因子分析特点


因子个数远小于变量个数;


能够反应原变量的绝大数信息;


因子之间的线性关系不显着;


因子具有命名解释性




因子分析步骤


1.原有变量是否能够进行因子分析;

2.提取因子;


3.因子的命名解释;


4.计算因子得分;五、综合评价




因子与主成分分析的区别


相同:都能够起到处理多个原始变量内在结构关系的作用


不同:主成分分析重在综合原始变适的信息.而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法


因子分析可以看做是优化后的主成分分析,两种方法有很多共通的地方,但应用方面各有侧重。




因子分析应用场景



因子分析方法主要用于三种场景,分别是:


l 信息浓缩 :将多个分析项浓缩成几个关键概括性指标。比如将多个问卷题浓缩成几个指标。如果偏重信息浓缩且关注指标与分析项对应关系,使用因子分析更为适合。


l 权重计算 :利用方差解释率值计算各概括性指标的权重。在信息浓缩的基础上,可进一步计算每个主成分/因子的权重,构建指标权重体系。


l 综合竞争力 :利用成分得分和方差解释率这两项指标,计算得到综合得分,用于综合竞争力对比(综合得分值越高意味着竞争力越强)。此类应用常见于经济、管理类研究,比如上市公司的竞争实力对比。




因子分析案例


现在有 12 个地区的 5 个经济指标调查数据(总人口、学校校龄、总雇员、专业服务、中等房价),为对这 12 个地区进行综合评价,请确定出这 12 个地区的综合评价指标。( 综合竞争力应用场景


同一指标在不同地区是不同的,用单一某一个指标难以对12个地区进行准确的评价,单一指标只能反映地区的某一方面。所以,有必要确定综合评价指标,便于对比。因子分析方法就可以应用在这个案例中。


5 个指标即为我们分析的对象,我们希望从这5个可观测指标中寻找出潜在的因素,用这些具有综合信息的因素对各地区进行评价。


下图spss因子分析的操作界面主要包括5方面的选项,变量区只能选择数值型变量,分类型变量不能进入该模型。


spss软件为了消除不同变量间量纲和数量级对结果的影响,在该过程中默认自动进行标准化处理,因此不需要对这些变量提前进行标准化处理。

 



描述统计选项卡


希望看到各变量的描述统计信息,要对比因子提取前后的方差变化,选定“单变量描述性”和“原始分析结果”;


现在是基于相关矩阵提取因子,所以,选定相关矩阵的“系数和显着性水平“,


另外,比较重要的还有 KMO 和球形检验,通过KMO值,我们可以初步判断该数据集是否适合采用因子分析方法,kmo结果有时并不会出现,这主要与变量个数和样本量大小有关。

 

 



抽取选项卡:在该选项卡中设置如何提取因子


提取因子的方法有很多,最常用的就是主成分法。


因为参与分析的变量测度单位不同,所以选择“相关矩阵”,如果参与分析的变量测度单位相同,则考虑选用协方差矩阵。


经常用到碎石图对于判断因子的个数很有帮助,一般都会选择该项。关于特征值,一般spss默认只提取特征值大于1的因子。收敛次数比较重要,可以从首次结果反馈的信息进行调整。

 

 


因子旋转选项卡


因子分析要求对因子给予命名和解释,是否对因子旋转取决于因子的解释。


旋转就是坐标变换,使得因子系数向1 和 0 靠近,对公因子的命名和解释更加容易。旋转方法一般采用”最大方差法“即可,输出旋转后的因子矩阵和载荷图,对于结果的解释非常有帮助。


如果不经旋转因子已经很好解释,那么没有必要旋转,否则,应该旋转。

 

 


保存因子得分


要计算因子得分就要先写出因子的表达式。因子是不能直接观察到的,是潜在的。但是可以通过可观测到的变量获得。


因子分析模型是原始变量为因子的线性组合,现在我们可以根据回归的方法将模型倒过来,用原始变量也就是参与分析的变量来表示因子。从而得到因子得分。因子得分作为变量保存,对于以后深入分析很有用处。

 




结果解读:验证数据是否适合做因子分析


参考kmo结果,一般认为大于0.5,即可接受。同时还可以参考相关系数,一般认为分析变量的相关系数多数大于 0.3,则适合做因子分析;


KMO=0.575 检验来看,不是特别适合因子分析,基本可以通过。


 

 



结果解读:因子方差表


提取因子后因子方差的值均很高,表明提取的因子能很好的描述这 5 个指标。


方差分解表表明,默认提取的前两个因子能够解释 5 个指标的 93.4%。碎石图表明,从第三个因子开始,特征值差异很小。综上,提取前两个因子。


 

 

 

 



结果解读:因子矩阵


旋转因子矩阵可以看出,经旋转后,因子便于命名和解释。


因子 1主要解释的是中等房价、专业服务项目、中等校平均校龄,可以命名为社会福利因子;


因子 2 主要解释的是其余两个指标,总人口和总雇员。可以命名为人口因子。


因子分析要求最后得到的因子之间相互独立,没有相关性,而因子转换矩阵显示,两个因子相关性较低。可见,对因子进行旋转是完全有必要的。


 



结果解读:因子系数


因子得分就是根据这个系数和标准化后的分析变量得到的。在数据视图中可以看到因子得分变量。



结论


经过因子分析实现了目的,找到了两个综合评价指标,人口因子和福利因子。


从原来的 5 个指标挖掘出 2 个潜在的综合因子。可以对12 个地区给出客观评价。

 

 

 

可以根据因子1或因子2得分,对这12个地区进行从大到小排序,得分高者被认为在这个维度上有较好表现。



② 求助:spss用因子分析法 怎么得到因子得分和排名

通过因子分析中一个选项保存因子得分,然后系统会在原数据最后保存生成3列因子得分,将假设为a1、a2、a3代表3个因子,然后根据因子分析得出三个因子的特征根值,分别计算粗3个因子的权重,分别为各自的特征根值/三个因子特征根值之和。

然后综合因子得分=a1*对应权重+a2*对应权重+a3*对应权重,之后就根据综合因子得分进行大小排名即可。

(2)计算因子得分的方法有哪些扩展阅读

(i)因子分析法的分析步骤

⑴确认待分析的原变量是否适合作因子分析。

⑵构造因子变量。

⑶利用旋转方法使因子变量更具有可解释性。

⑷计算因子变量得分。

(ii)因子分析的计算过程:

⑴将原始数据标准化,以消除变量间在数量级和量纲上的不同。

⑵求标准化数据的相关矩阵;

⑶求相关矩阵的特征值和特征向量;

⑷计算方差贡献率与累积方差贡献率;

⑸确定因子:

设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;

⑹因子旋转:

若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。

⑺用原指标的线性组合来求各因子得分:

采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。

⑻综合得分

以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。

F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )

此处wi为旋转前或旋转后因子的方差贡献率。

⑼得分排序:利用综合得分可以得到得分名次。

③ 因子分析法(FA)

3.2.1.1 技术原理

因子分析是研究相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。R型因子分析研究变量(指标)之间的相关关系,通过对变量的相关阵或协方差阵内部结构的研究,找出控制所有变量的几个公共因子(或称主因子、潜因子),用以对变量或样品进行分类;Q型因子分析研究样品之间的相关关系,通过对样品的相似矩阵内部结构的研究找出控制所有样品的几个主要因素(或称主因子)这两种因子分析的处理方法一样,只是出发点不同。R型从变量的相关阵出发,Q型从样品的相似矩阵出发。对一批观测数据,可以根据实际问题的需要来决定采用哪一种类型的因子分析。

对多变量的平面数据进行最佳综合和简化,即在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理。可以通过下面的数学模型来表示:

地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例

式中:x1,x2,…,xi是p个原有变量,是均值为零、标准差为1的标准化变量,经过降维处理,p个变量可以综合成m个新指标 F1,F2,…,Fm,且 x 可由 Fm线性表示出,即:x=AF+ε,其中矩阵A=(αijp×m,为因子载荷矩阵,aij统计学中称为“权重”。

地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例

式中:A是第i个原有变量在第j个因子变量上的负荷,公共因子矩阵F=(F1,F2,…,Fm),特殊因子矩阵ε=(ε1,ε2,…,εiT,表示了原有变量不能被因子变量所解释的部分,相当于多元回归分析中的残差部分。

因子载荷矩阵A中各行元素的平方和,称为变量共同度,是全部公共因子对变量Xi的总方差所作出的贡献,称为公因子方差,表明xi对公共因子F1,F2,…,Fm的共同依赖程度。

地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例

因子载荷矩阵A中各列元素的平方和,记为

地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例

式中:

的统计意义与

恰好相反,

表示第j个公共因子Fj对X的所有分量x1,…,xp的总影响,称为第j个公共因子Fj对x的贡献,它是衡量第j个公共因子相对重要性的指标。目前用于估计A的方法主要有主因成分法、主因子解和极大似然法。

3.2.1.2 技术流程

(1)数据合理性检验

因子分析的应用要求原始变量之间有较强的相关关系,因此,在分析之前,首先需要对数据进行相关性分析,最简单的方法就是计算变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验中,大部分都小于0.3,那么这些变量就不适合进行因子分析。SPSS常用的统计检验方法有巴特利特球形检验、反映像相关矩阵检验和KMO检验。

巴特利特球形检验(Bartlett Test of Sphericity),若检验统计量较大,则认为原始数据间存在相关性,适合进行因子分析,否则不适合。

反映像相关矩阵检验(Anti-image Correlation Matrix),反映像相关矩阵中元素的绝对值比较大,那么说明这些变量不适合做因子分析。

KMO(Kaiser Meyer Olkin)检验如表3.1。

表3.1 KMO检验标准表

(2)构造因子变量

构造因子变量的方法有很多种,如基于主成分模型的主成分分析法和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。

(3)利用旋转使得因子变量更具有可解释性

载荷矩阵A中某一行可能有多个aij比较大,说明某个原有变量可能同时与几个因子有比较大的相关关系;同时载荷矩阵A中某一列中也可能有多个aij较大,说明某个因子变量可能解释多个原变量的信息,但它只能解释某个变量一小部分信息,不是任何一个变量的典型代表,会使某个因子变量的含义模糊不清。在实际分析中,希望对因子变量的含义有比较清楚的认识,这时,可以通过因子矩阵的旋转来进行。旋转的方式有正交旋转、斜交旋转、方差极大法,其中最常用的是方差极大法。

(4)计算因子变量的得分

计算因子得分首先将因子变量表示为原有变量的线性组合,即:

Fm=βm1x1m2x2+…+βmixi (3.5)

估计因子得分的方法有回归法、Bar-tlette法、Anderson-Rubin 法等。默认取特征值大于1的公因子或累计贡献率大于85%(70%或90%)的最小正整数的因子(图3.2)。

图3.2 技术流程图

3.2.1.3 适用范围

因子分析是研究相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。FA法使用简单,不需要研究地区优先源的监测数据,在缺乏污染源成分谱的情况下仍可解析,并可广泛使用统计软件处理数据。其不足之处在于需要输入大量数据,而且只能得到各类元素对主因子的相对贡献百分比。

④ 因子分析方法

因子分析是一种多变量化简技术,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性较低,每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。其分析方法有很多种,最常用的有两种:一是主成分分析方法;另外一种是一般因子分析法。通常所说的因子分析指的就是一般因子分析法,它通过原始变量的方差去构造因子,一般情况下,因子的数量总是要少于变量的数量。所以对于一般因子分析而言,如何正确解释因子将会比主成分分析更困难。

因子分析一般可以分成四步:

考察变量之间的相关性,判断是否要进行因子分析;

进行分析,按一定的标准确定提取的因子数目,一般要求特征值大于1;

考察因子的可解释性,并在必要时进行因子旋转,以寻求最佳解释方式;

计算出因子得分等中间指标,供进一步分析使用。

利用因子分析,可以把搜集到的比较杂乱的原始数据进行压缩,找出最重要的因子,并对其按照成因归类、整理,从中找出几条主线,帮助分析充满度的主要控制因素。

本研究中共统计岩性圈闭354个,参与统计分析和计算的圈闭有249个。由于其中的落空圈闭无法参与因子分析及充满度预测模型的建立,因此实际参与分析和预测的岩性油气藏为222个。初步地质分析后,选取平均孔隙度,%;平均渗透率,10-3μm2;排烃强度,104t/km2;与排烃中心的平面距离,km;与排烃中心的垂直距离,m;地层压力系数;砂体厚度,m;砂体面积,km2;有机质丰度,%;围岩厚度,m;平均埋深,m;共11个地质参数进行因子分析。

本研究按不同的成藏体系进行,建立其充满度预测模型并进行回代验证。同一成藏体系内的岩性油气藏的生、储、盖、圈、运、保等成藏条件相互影响、相互制约,关系密切,将同一成藏体系中的岩性油气藏又分别划分为构造-岩性、透镜体油气藏进行预测。

⑤ 因子分析法的分析步骤

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
(i)因子分析常常有以下四个基本步骤:
⑴确认待分析的原变量是否适合作因子分析。
⑵构造因子变量。
⑶利用旋转方法使因子变量更具有可解释性。
⑷计算因子变量得分。
(ii)因子分析的计算过程:
⑴将原始数据标准化,以消除变量间在数量级和量纲上的不同。
⑵求标准化数据的相关矩阵;
⑶求相关矩阵的特征值和特征向量;
⑷计算方差贡献率与累积方差贡献率;
⑸确定因子:
设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;
⑹因子旋转:
若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
⑺用原指标的线性组合来求各因子得分:
采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
⑻综合得分
以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此处wi为旋转前或旋转后因子的方差贡献率。
⑼得分排序:利用综合得分可以得到得分名次。
在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:
· 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。
· 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。
· 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。
如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。

⑥ 请问怎么在SPSS中计算各维度的因子分

在SPSS中计算各维度的因子分方法如下:

  1. 分析——降维——因子分析;

  2. 自变量的题目和因变量的题目要独立分析;

  3. 将要做分析的题目选择到右边的白框之后,打钩,抽取”和“选项”两个不用管他。然后就点“确定;

  4. 按照上述步骤操作下来之后,就可以得到结果。

因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性估值。在社会学研究中,因子分析常采用以主成分分析为基础的反复法。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

⑦ spss中 综合因子得分的计算

1、进入spss表格后点击转换,再点击计算变量。

(7)计算因子得分的方法有哪些扩展阅读:

计算公式:总得分=因子1的方差贡献率*因子1的得分+因子2的方差贡献率*因子2的得分+......

如果要计算综合得分,需要用每个共因子的方差贡献率做权数,对每个因子进行加权,然后加总得到,这个以方差贡献率为权数计算综合得分的方法SPSS是不带的,要自己计算。

⑧ spss19.0用因子分析法计算综合得分(用来比较业绩的),跪求大神教个详细做法

因子分析只是一个基础的工作,因子得分不是因子分析的最终结果,因子得分可以作为变量进行回归分析、聚类分析、计算因子的综合得分等等。

1、因子综合得分在因子得分的后续运用中很是重要。没有必要在Excel中建立计算公式,spss的功能很强大,操作见图片。计算出后,可一再建立一个“排序”变量,按降序方法来排序。

再对scores排序即可。

阅读全文

与计算因子得分的方法有哪些相关的资料

热点内容
面粉做蛋糕发酵方法与步骤 浏览:330
华为手机的悬浮窗的便捷方法 浏览:694
八年级上册昆虫记教学方法 浏览:37
直播管理的方法和技巧 浏览:49
敏感度比较高的hpv检测方法 浏览:123
太阳能路灯灯头的连接方法 浏览:414
结石用什么方法最快排出 浏览:560
中药人参的的作用及食用方法 浏览:21
三洋使用方法 浏览:178
小米5开关机时间设置在哪里设置方法 浏览:763
怎么让腿变快的方法 浏览:172
易企秀手机版使用方法怎么保存 浏览:694
戒烟自由的最佳方法 浏览:438
70迈停车监控线连接方法 浏览:908
常用螺纹联接防松方法及应用 浏览:752
课堂研究设计方法分析 浏览:815
面粉做豆沙包子的方法与步骤 浏览:198
东北酸菜怎么快速腌制方法 浏览:191
野钓的正确方法图片 浏览:730
做深蹲的正确呼吸方法是什么 浏览:845