1. 因子分析法和主成分分析法的区别与联系是什么
联系:因子分析法和主成分分析法都是统计分析方法,都要对变量标准化,并找出相关矩阵。区别:在主成分分析中,最终确定的新变量是原始变量的线性组合,因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系。
1.因子分析法通过正交变换,将一组可能具有相关性的变量转换为一组线性不相关的变量,称为主成分。它主要用于市场研究领域。在市场研究中,研究人员关注一些研究指标的整合或组合。这些概念通常通过分数来衡量。人口学、数量地理学、分子动力学模拟、数学建模、数学分析等学科。因子分析和主成分分析都是统计分析方法,都需要对变量进行标准化,找出相关矩阵。
2.因子分析可以在许多变量中发现隐藏的代表性因素。主成分分析的原理是尝试将原始变量重新组合成一组新的独立综合变量。因子分析在主成分分析的基础上增加了一个旋转函数。这种轮换的目的是更容易地命名和解释因素的含义。如果研究的重点是指标与分析项目之间的对应关系,或者想要对得到的指标进行命名,建议使用因子分析。
3.主成分分析法是根据实际需要,尽量选取尽可能少的求和变量,以反映原始变量的信息。这种统计方法称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析试图用一套新的不相关的综合指标取代原有指标。因子分析是社会研究的有力工具,但它不能确定一项研究中有多少因素。当研究中选择的变量发生变化时,因素的数量也会发生变化。
拓展资料:霍特林将这种方法推广到随机向量的情况。信息的大小通常由方差或方差的平方和来衡量。因子分析最早由英国心理学家C.E.斯皮尔曼提出。他发现学生在不同科目的成绩之间有一定的相关性。一门学科成绩好的学生往往在其他学科成绩更好,因此他推测是否有一些潜在的共同因素或一些一般的智力条件影响学生的学业成绩。
2. 因子分析法和主成分分析法的区别与联系
一、方式不同:
1、因子分析法:
通过从变量群中提取共性因子
2、主成分分析法:
通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
二、应用不同:
1、因子分析法:
主要应用于市场调研领域,在市场调研中,研究人员关心的是一些研究指标的集成或者组合,这些概念通常是通过等级评分问题来测量的。
2、主成分分析法:
人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用。
三、联系:
因子分析法和主成分分析法都是统计分析方法,都要对变量标准化,并找出相关矩阵。
(2)因子分析的三种方法主因子分析法扩展阅读
主成分分析首先是由K.皮尔森(Karl Pearson)对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
因子分析法最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。
3. 因子分析可分为哪三个步骤
职务分析是一项技术性很强的工作,需要做周密的准备。同时还需具有与人力资源管理活动相匹配的科学的、合理的操作程序。 (一)准备阶段 1、建立工作分析小组。小组成员通常由分析专家构成。所谓分析专家,是指具有分析专长,并对组织结构及组织内各项工作有明确概念的人员。一旦小组成员确定之后,赋予他们进行分析活动的权限,以保证分析工作的协调和顺利进行。 2、明确工作分析的总目标、总任务。根据总目标、总任务,对企业现状进行初步了解,掌握各种数据和资料。 3、明确工作分析的目的。有了明确的目的,才能正确确定分析的范围、对象和内容,规定分析的方式、方法,并弄清应当收集什么资料,到哪儿去收集,用什么方法去收集。 4、明确分析对象。为保证分析结果的正确性,应该选择有代表性、典型性的工作。 5、建立良好的工作关系。为了搞好工作分析,还应做好员工的心理准备工作,建立起友好的合作关系。 (二)调查阶段 分析人员应制定工作分析的时间计划进度表,以保证这项工作能够按部就班的进行调查。同时搜集有关职位的相关信息。这一阶段包括以下几项内容: 1、选择信息来源。信息主要来源于:工作执行者本人、管理监督者、顾客、分析专家、职业名称辞典以及以往的分析资料。 2、选择收集信息的方法和系统。信息收集的方法和分析信息适用的系统由工作分析人员根据企业的实际需要灵活运用。 3、搜集职位的相关信息 (三)分析阶段 工作分析就是审查、分析企业某个工作有关的信息的过程。也就是说,该阶段包括信息的整理、审查、分析三个相关活动,是整个工作分析过程的主要部分。 1、工作名称该名称必须明确,使人看到工作名称,就可以大致了解工作内容。如果该工作已完成了工作评价,在工资上已有固定的等级,则名称上可加上等级。 2、聘用人员数目同一工作所聘用工作人员的数目和性别,应予以记录。 3、工作单位工作单位是显示工作所在的单位及其上下左右的关系,也就是说明工作的组织位置。 4、职责所谓职责,就是这项工作的权限和责任有多大,主要包括以下几方面: 5、工作知识工作知识是为圆满完成某项工作,工作人员应具备的实际知识。这种知识应包括任用后为执行其工作任务所需获得的知识,以及任用前已具备的知识。 6、智力要求智力要求指在执行过程中所需运用的智力,包括判断、决策、警觉、主动、积极、反应、适应等。
4. 主成分分析和因子分析是什么
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。
主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
主成分分析和因子分析的不同:
1、原理不同:
主成分分析是利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,使得主成分比原始变量具有某些更优越的性能,从而达到简化系统结构,抓住问题实质的目的。
而因子分析更倾向于从数据出发,描述原始变量的相关关系,是由研究原始变量相关矩阵内部的依赖关系出发,把错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。
2、线性表示方向不同:
主成分分析中是把主成分表示成各变量的线性组合,而因子分析是把变量表示成各公因子的线性组合。
3、假设条件不同:
主成分分析不需要有假设条件;而因子分析需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关。
5. 主成份分析和因子分析分别是什么
主成分分析和因子分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。
因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名,更容易解释因子的含义。如果研究关注于指标与分析项的对应关系上,或是希望将得到的指标进行命名,SPSSAU建议使用因子分析。
主成分分析目的在于信息浓缩(但不太关注主成分与分析项对应关系),权重计算,以及综合得分计算。如希望进行排名比较,计算综合竞争力,可使用主成分分析。
SPSSAU可直接使用这两种方法,支持自动保存因子得分及综合得分,不需要手动计算。
(5)因子分析的三种方法主因子分析法扩展阅读:
用F1的分量作为系数,用标准化变量Z1,…Zk作为新变量建立线性组合F1,称为第1主成份。用F2的分量作为系数,用标准比变量Z1,…Zk作为新变量,建立线性组合后,称为第2主成份。由此可见,主成份F1、F2都是综合性指标。
将数据标准化的数值代入建立的线性组合F1、F2中,就可得出第1主成份和第2主成份的得分,并以此得分高低来排出名次,从而对所研究的问题作出分析评价。
6. 主成分分析法与因子分析法的区别
一、性质不同
1、主成分分析法性质:通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量。
2、因子分析法性质:研究从变量群中提取共性因子的统计技术。
二、应用不同
1、主成分分析法应用:比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。
2、因子分析法应用:
(1)消费者习惯和态度研究(U&A)
(2) 品牌形象和特性研究
(3)服务质量调查
(4) 个性测试
(5)形象调查
(6) 市场划分识别
(7)顾客、产品和行为分类
(6)因子分析的三种方法主因子分析法扩展阅读:
主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时,根据实际需要,尽量少取几个求和变量,以反映原始变量的信息。
这种统计方法被称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析(PCA)是试图用一组新的不相关的综合指标来代替原来的指标。
因子分析为社会研究的一种有力工具,但不能确定一项研究中有几个因子。当研究中选择的变量发生变化时,因素的数量也会发生变化。此外,对每个因素的实际含义的解释也不是绝对的。
7. 试述主成分分析,因子分析和对应分析三者之间的区别与联系
一、方式不同:
1、主成分分析:
通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
2、因子分析:
通过从变量群中提取共性因子,因子分析可在许多变量中找出隐藏的具有代表性的因子。
3、对应分析:
通过分析由定性变量构成的交互汇总表来揭示变量。
二、作用体现不同:
1、主成分分析:
主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用。
2、因子分析:
因子分析在市场调研中有着广泛的应用,主要包括消费者习惯和态度研究、品牌形象和特性研究、服务质量调查、个性测试。
3、对应分析:
能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,是一种直观、简单、方便的多元统计方法。
(7)因子分析的三种方法主因子分析法扩展阅读
主成分分析对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
对应分析是由法国人Benzenci于1970年提出的,起初在法国和日本最为流行,然后引入到美国。对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法,因此对应分析又称为R-Q型因子分析。
在因子分析中,如果研究的对象是样品,则需采用Q型因子分析;如果研究的对象是变量,则需采用R型因子分析。但是,这两种分析方法往往是相互对立的,必须分别对样品和变量进行处理。
8. 因子分析法的分析步骤
因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
(i)因子分析常常有以下四个基本步骤:
⑴确认待分析的原变量是否适合作因子分析。
⑵构造因子变量。
⑶利用旋转方法使因子变量更具有可解释性。
⑷计算因子变量得分。
(ii)因子分析的计算过程:
⑴将原始数据标准化,以消除变量间在数量级和量纲上的不同。
⑵求标准化数据的相关矩阵;
⑶求相关矩阵的特征值和特征向量;
⑷计算方差贡献率与累积方差贡献率;
⑸确定因子:
设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;
⑹因子旋转:
若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
⑺用原指标的线性组合来求各因子得分:
采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
⑻综合得分
以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此处wi为旋转前或旋转后因子的方差贡献率。
⑼得分排序:利用综合得分可以得到得分名次。
在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:
· 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。
· 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。
· 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。
如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。
9. 因子分析的简介
因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反复法。
主成分分析为基础的反复法主成分分析的目的与因子分析不同,它不是抽取变量群中的共性因子,而是将变量□1,□2,…,□□进行线性组合,成为互为正交的新变量□1,□2,…,□□,以确保新变量具有最大的方差:
在求解中,正如因子分析一样,要用到相关系数矩阵或协方差矩阵。其特征值□1,□2,…,□□,正是□1,□2,…,□□的方差,对应的标准化特征向量,正是方程中的系数□,□,…,□。如果□1>□2,…,□□,则对应的□1,□2,…,□□分别称作第一主成分,第二主成分,……,直至第□主成分。如果信息无需保留100%,则可依次保留一部分主成分□1,□2,…,□□(□<□)。
当根据主成分分析,决定保留□个主成分之后,接着求□个特征向量的行平方和,作为共同性□:
□并将此值代替相关数矩阵对角线之值,形成约相关矩阵。根据约相关系数矩阵,可进一步通过反复求特征值和特征向量方法确定因子数目和因子的系数。
因子旋转为了确定因子的实际内容,还须进一步旋转因子,使每一个变量尽量只负荷于一个因子之上。这就是简单的结构准则。常用的旋转有直角旋转法和斜角旋转法。作直角旋转时,各因素仍保持相对独立。在作斜角旋转时,允许因素间存在一定关系。
Q型因子分析 上述从变量群中提取共性因子的方法,又称R型因子分析和R型主要成分分析。但如果研究个案群的共性因子,则称Q型因子分析和Q型主成分分析。这时只须把调查的□个方案,当作□个变量,其分析方法与R型因子分析完全相同。
因子分析是社会研究的一种有力工具,但不能肯定地说一项研究中含有几个因子,当研究中选择的变量变化时,因子的数量也要变化。此外对每个因子实际含意的解释也不是绝对的。
10. 因子分析法(FA)
3.2.1.1 技术原理
因子分析是研究相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。R型因子分析研究变量(指标)之间的相关关系,通过对变量的相关阵或协方差阵内部结构的研究,找出控制所有变量的几个公共因子(或称主因子、潜因子),用以对变量或样品进行分类;Q型因子分析研究样品之间的相关关系,通过对样品的相似矩阵内部结构的研究找出控制所有样品的几个主要因素(或称主因子)这两种因子分析的处理方法一样,只是出发点不同。R型从变量的相关阵出发,Q型从样品的相似矩阵出发。对一批观测数据,可以根据实际问题的需要来决定采用哪一种类型的因子分析。
对多变量的平面数据进行最佳综合和简化,即在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理。可以通过下面的数学模型来表示:
地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例
式中:x1,x2,…,xi是p个原有变量,是均值为零、标准差为1的标准化变量,经过降维处理,p个变量可以综合成m个新指标 F1,F2,…,Fm,且 x 可由 Fm线性表示出,即:x=AF+ε,其中矩阵A=(αij)p×m,为因子载荷矩阵,aij统计学中称为“权重”。
地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例
式中:A是第i个原有变量在第j个因子变量上的负荷,公共因子矩阵F=(F1,F2,…,Fm),特殊因子矩阵ε=(ε1,ε2,…,εi)T,表示了原有变量不能被因子变量所解释的部分,相当于多元回归分析中的残差部分。
因子载荷矩阵A中各行元素的平方和,称为变量共同度,是全部公共因子对变量Xi的总方差所作出的贡献,称为公因子方差,表明xi对公共因子F1,F2,…,Fm的共同依赖程度。
地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例
因子载荷矩阵A中各列元素的平方和,记为
地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例
式中:
3.2.1.2 技术流程
(1)数据合理性检验
因子分析的应用要求原始变量之间有较强的相关关系,因此,在分析之前,首先需要对数据进行相关性分析,最简单的方法就是计算变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验中,大部分都小于0.3,那么这些变量就不适合进行因子分析。SPSS常用的统计检验方法有巴特利特球形检验、反映像相关矩阵检验和KMO检验。
巴特利特球形检验(Bartlett Test of Sphericity),若检验统计量较大,则认为原始数据间存在相关性,适合进行因子分析,否则不适合。
反映像相关矩阵检验(Anti-image Correlation Matrix),反映像相关矩阵中元素的绝对值比较大,那么说明这些变量不适合做因子分析。
KMO(Kaiser Meyer Olkin)检验如表3.1。
表3.1 KMO检验标准表
(2)构造因子变量
构造因子变量的方法有很多种,如基于主成分模型的主成分分析法和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。
(3)利用旋转使得因子变量更具有可解释性
载荷矩阵A中某一行可能有多个aij比较大,说明某个原有变量可能同时与几个因子有比较大的相关关系;同时载荷矩阵A中某一列中也可能有多个aij较大,说明某个因子变量可能解释多个原变量的信息,但它只能解释某个变量一小部分信息,不是任何一个变量的典型代表,会使某个因子变量的含义模糊不清。在实际分析中,希望对因子变量的含义有比较清楚的认识,这时,可以通过因子矩阵的旋转来进行。旋转的方式有正交旋转、斜交旋转、方差极大法,其中最常用的是方差极大法。
(4)计算因子变量的得分
计算因子得分首先将因子变量表示为原有变量的线性组合,即:
Fm=βm1x1+βm2x2+…+βmixi (3.5)
估计因子得分的方法有回归法、Bar-tlette法、Anderson-Rubin 法等。默认取特征值大于1的公因子或累计贡献率大于85%(70%或90%)的最小正整数的因子(图3.2)。
图3.2 技术流程图
3.2.1.3 适用范围
因子分析是研究相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。FA法使用简单,不需要研究地区优先源的监测数据,在缺乏污染源成分谱的情况下仍可解析,并可广泛使用统计软件处理数据。其不足之处在于需要输入大量数据,而且只能得到各类元素对主因子的相对贡献百分比。