导航:首页 > 研究方法 > 判别分析是什么方法

判别分析是什么方法

发布时间:2022-08-16 07:10:17

‘壹’ 判别分析的建立方法

建立判别函数的方法一般由四种:全模型法、向前选择法、向后选择法和逐步选择法。
1)全模型法是指将用户指定的全部变量作为判别函数的自变量,而不管该变量是否对研究对象显着或对判别函数的贡献大小。此方法适用于对研究对象的各变量有全面认识的情况。如果未加选择的使用全变量进行分析,则可能产生较大的偏差。
2)向前选择法是从判别模型中没有变量开始,每一步把一个队判别模型的判断能力贡献最大的变量引入模型,直到没有被引入模型的变量都不符合进入模型的条件时,变量引入过程结束。当希望较多变量留在判别函数中时,使用向前选择法。
3)向后选择法与向前选择法完全相反。它是把用户所有指定的变量建立一个全模型。每一步把一个对模型的判断能力贡献最小的变量剔除模型,知道模型中的所用变量都不符合留在模型中的条件时,剔除工作结束。在希望较少的变量留在判别函数中时,使用向后选择法。
4)逐步选择法是一种选择最能反映类间差异的变量子集,建立判别函数的方法。它是从模型中没有任何变量开始,每一步都对模型进行检验,将模型外对模型的判别贡献最大的变量加入到模型中,同时也检查在模型中是否存在“由于新变量的引入而对判别贡献变得不太显着”的 变量,如果有,则将其从模型中出,以此类推,直到模型中的所有变量都符合引入模型的条件,而模型外所有变量都不符合引入模型的条件为之,则整个过程结束。

‘贰’ 什么是逐步判别分析

逐步判别法:按照所指定的纳入/排除标准,依次引入和剔除变量,直到方程稳定为止。该方法实质和多元回归分析中的逐步法等价。

‘叁’ 判别分析属于多元分析方法

属于。判别分析是多元统计中用于判别样品所属类型的一种统计分析方法。

‘肆’ 聚类分析与判别分析有什么区别与联系

1.聚类分析与判别分析的区别与联系 都是研究分类的,在进行聚类分析前,对总体到底有几种类型不知道(研究分几类较为合适需从计算中加以调整)。判别分析则是在总体类型划分已知,对当前新样本判断它们属于哪个总体。如我们对研究的多元数据的特征不熟悉,当然要进行聚类分析,才能考虑判别分析问题。2.聚类分析分两种:Q型聚类(对样本的聚类),P型聚类(对变量的聚类) 聚类分析需要注意的是,一般小样本数据可以用系统聚类法,大样本数据一般用快速聚类法(K均值聚类法)。需要根据统计量判断分几类比较合适,一般用R平方统计、伪F统计量等。如用前者时,可以从R平方的变换看n个样品分成几类比较合适,如分为5类时,R平方为0.9,当分为四类时,其值减小较快,如R平方为0.4,则认为分五类比较合适。另外,不同的分类方法产生的分类结果可能不同,要结合实际情况选出最优的分类方法。3.判别分析 有Fisher判别,Bayes判别和逐步判别。一般用Fisher判别即可,要考虑概率及误判损失最小的用Bayes判别,但变量较多时,一般先进行逐步判别筛选出有统计意义的变量,再结合实际情况选择用哪种判别方法。

‘伍’ 信用评分模型是什么分为哪些

1、信用评分模型是什么?

信用评分模型是近年来兴起的一种为了保障银行和其他金融部门的金融安全而设立的一种关于人身金融权限的划定模型。该模型指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数,根据客户的信用分数,来决定客户所可以持有的金额权限,从而保证还款等业务的安全性。而随着在现代社会和公司中,贷款,信用卡的作用日渐突出,信用评分模型的发展前景不可估量。

2、分为哪些?

(1)判别分析模型
判别分析法是对研究对象所属类别进行判别的一种统计分析方法。进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值。判别分析就是要从中筛选出能提供较多信息变量并建立判别函数,使推导出的判别函数对观测样本分类时的错判率最小。这种方法的理论基础是样本由两个分布有显着差异的子样本组成,并且它们拥有共同的属性。它起源于1936年Fisher引进的线性判别函数,这个函数的目的是寻找一个变量的组合,把两个拥有一些共同特征的组区分开来。

判别分析方法的优点适用于二元或多元性目标变量,能够判断,区分个体应该属于多个不同小组中的哪一组。自身也存在不可避免的缺点:该模型假设前提是自变量的分布都是正态分布的而实践中的数据往往不是完全的正态分布,从而导致统计结果的不可靠性。

(2)决策树方法
决策树模型是对总体进行连续的分割,以预测一定目标变量的结果的统计技术。决策树构造的输入是一组带有类别标记的例子构造的结果是一棵二叉或多叉树。构造决策树的方法是采用自上而下的递归构造。在实际中为进行个人信用分析选取个人信用作为目标属性,其他属性作为独立变量。所有客户被划分为两类,即好客户的和坏客户,将客户信用状况转换为是否好客户”(值为1或0而后利用数据集合来生成一个完整的决策树。在生成的决策树中可以建立一个规则基。一个规则基包含一组规则每一条规则对应决策树的一条不同路径,这条路径代表它经过节点所表示的条件的一条链接。通过创立一个对原始祥本进行最佳分类判别的决策树,采用递归分割方法使期望误判损失达到最小。

决策树模型的优点:浅层的决策树视觉上非常直观,容易解释;对数据的结构和分布不需做任何假设:可以容易地转化成商业规则。它的缺点在干:深层的决策树视觉上和解释上都比较困难;决策树对样本量的需求比较大;决策树容易过分微调于样本数据而失去稳定性和抗震荡性。

(3)回归分析法
回归分析法是目前为止应用最为广泛的一种信用评分模型这其中以着名的logistic回归为代表。除此之外,线性回归分析、probit回归等方法亦属于此类。最早使用回归分析的Orgler他采用线性回归模型制定了一个类似于信用卡的评分卡,他的研究表明消费者行为特征比申请表资料更能够预测未来违约可能性的大小。同数学规划方法中一样假设已经通过一定的方法从样本变量中提取出了若干指标作为特征向量回归分析的思想就是将这些指标变量拟合成为一个可以预测申请者违约率的被解释变量自然就是违约率p回归分析中应用最广泛的模型当属线性回归模型它是对大量的数据点中表现出来的数量关系模拟出一条直线,回日分析的目标就是使目标变量值和实际的目标变量值之间的误差最小。因此最早将回归方法应用于信用评分研究的模型,就是简单的线性回归模型,目前基于logistic回归的信用评分系统应用最为普遍。

‘陆’ 判别分析的判别方法

判别方法是确定待判样品归属于哪一组的方法,可分为参数法和非参数法,也可以根据资料的性质分为定性资料的判别分析和定量资料的判别分析。此处给出的分类主要是根据采用的判别准则分出几种常用方法。除最大似然法外,其余几种均适用于连续性资料。
1)最大似然法:用于自变量均为分类变量的情况,该方法建立在独立事件概率乘法定理的基础上,根据训练样品信息求得自变量各种组合情况下样品被封为任何一类的概率。当新样品进入是,则计算它被分到每一类中去的条件概率(似然值),概率最大的那一类就是最终评定的归类。
2)距离判别:其基本思想是有训练样品得出每个分类的重心坐标,然后对新样品求出它们离各个类别重心的距离远近,从而归入离得最近的类。也就是根据个案离母体远近进行判别。最常用的距离是马氏距离,偶尔也采用欧式距离。距离判别的特点是直观、简单,适合于对自变量均为连续变量的情况下进行分类,且它对变量的分布类型无严格要求,特别是并不严格要求总体协方差阵相等。
3)Fisher判别:亦称典则判别,是根据线性Fisher函数值进行判别,通常用于梁祝判别问题,使用此准则要求各组变量的均值有显着性差异。该方法的基本思想是投影,即将原来在R维空间的自变量组合投影到维度较低的D维空间去,然后在D维空间中再进行分类。投影的原则是使得每一类的差异尽可能小,而不同类间投影的离差尽可能大。Fisher判别的优势在于对分布、方差等都没有任何限制,应用范围比较广。另外,用该判别方法建立的判别方差可以直接用手工计算的方法进行新样品的判别,这在许多时候是非常方便的。
4)Bayes判别:许多时候用户对各类别的比例分布情况有一定的先验信息,也就是用样本所属分类的先验概率进行分析。比如客户对投递广告的反应绝大多数都是无回音,如果进行判别,自然也应当是无回音的居多。此时,Bayes判别恰好适用。Bayes判别就是根据总体的先验概率,使误判的平均损失达到最小而进行的判别。其最大优势是可以用于多组判别问题。但是适用此方法必须满足三个假设条件,即各种变量必须服从多元正态分布、各组协方差矩阵必须相等、各组变量均值均有显着性差异。

‘柒’ 判别分析

化探工作中常要判断地质体的属性,如是矿致异常还是非矿致异常;是含矿岩体还是不含矿岩体;是含矿铁帽还是不含矿铁帽,等等。而区分它们只考虑一个变量,数据的重叠往往很难区分。用判别分析的方法建立起一个多变量的函数(判别函数),使两类地质体得到最大的分离,对于未知属性的地质体也算出这个函数值从而判断其归属。化探中常用的是两类线性判别分析,其具体做法如下。

1.求判别函数

(1)首先将已知的A地质体(如矿致异常)和B地质体(如非矿致异常)中各变量(如元素含量)换为对数值(因为化探中的微量元素多为对数正态分布)。

(2)建立求判别函数系数的线性方程组。

判别函数的一般表达式为:

地球化学找矿

式中:R为判别函数;λK为判别系数(K=1,2,…,P);P为变量数;xK为判别变量。

根据数学推导,判别系数λK应满足下列线性方程组:

地球化学找矿

为简化计算,可将dK前(NA+NB-2)系数取为1。

则有

地球化学找矿

地球化学找矿

式中:

地球化学找矿

地球化学找矿

NA与NB分别为A母体与B母体的样品数。

根据A,B两类地质体的各变量(对数值)代入上述公式即可求得σKK,σKL,dK各项值。于是线性方程组(6-6)或(6-7)即可得到。用适当方法求出线性方程组的解,即可求得判别系数λK(K=1,2,…,P),判别系数λK求得后代入(6-6)式,则判别函数R即已求得。注意判别系数λK有正有负。

2.判别效果的显着性检验

建立的判别函数判别是否有效主要看不同地质体中变量平均值的差异是否显着,即(K=1,2,…,P)是否足够大。通常采用马氏距离D2统计量作F检验。首先计算出D2和F值:

地球化学找矿

地球化学找矿

注意:若线性方程组(6-6)中dK前系数为(NA+NB-2)则:

地球化学找矿

然后给定信度α=0.1,α=0.05,α=0.01查F分布表得出

的临界值,若计算出

(临界值),则说明在某信度下差异显着,判别有效;若小于某一信度的临界值,则说明在该信度下差异不显着。若

还小,则说明A,B无显着差异,为同一地质体,因而判别无效;或者说明所选择的这些变量没有判别效果,应另选其他变量。

3.计算各变量的贡献值

判别有效时还应考虑各变量参加判别的贡献。变量的贡献值可以衡量一个变量对组成判别函数的作用大小。第K个变量的贡献值按下式计算:

地球化学找矿

对于贡献值很小的可舍去,用其余变量进行判别可得同样效果。

4.对未知属性样品进行判别

当判别函数判别有效时,则可对未知属性样品进行判别。

(1)计算判别函数临界值(R0

地球化学找矿

若NA=NB,则

地球化学找矿

式中:

R0算出后应比较三者的大小。若

,则大于R0者属A类,小于R0者属B类;若R(A)<R0<R(B),则大于R0者属B类,小于R0者属A类。

(2)与R0进行比较

将未知属性样品的诸变量值(对数值)代入判别函数,即可求得各未知属性样品的判别函数值,与R0比较则可判断其归属。

(3)计算实例

某区发现原生地球化学异常15个,其中7个为矿致异常,7个为非矿致异常,一个异常性质不明。每个异常分析了Cu,Ag,Bi3个元素,数据见表6-2。未知属性异常含量(10-6)Cu 880,Ag 1.41,Bi 34.4,换算成对数值(Ag乘以100后换算成对数)分别为2.945,2.147,1.537。

现运用判别分析的方法对未知属性异常判断其归属。

表6-2 某区Cu,Ag,Bi 元素含量及对数值

1)求判别函数

①根据矿致异常(A),非矿致异常(B)中各变量的对数值计算(表6-2)表中所列各项值(表6-3)。

②建立求判别函数系数的线性方程组,对于只有三个判别变量时,判别函数:

R =λ1x1+ λ2x2+ λ3x3 (6-12)

求判别系数λK(K=1,2,3)的线性方程组为:

地球化学找矿

式中:

地球化学找矿

地球化学找矿

表6-3 由表6-2导出的各参数值

于是(6-13)式变为:

地球化学找矿

对于上述方程组可用行列式求解:

地球化学找矿

地球化学找矿

地球化学找矿

将λ1,λ2,λ3的值代入(6-12)式,则得

地球化学找矿

上式即为所求的判别函数。

2)判别效果的显着性检验

计算D2值和

的值:

地球化学找矿

,查临界值表:

地球化学找矿

于是得

,其他均小于是临界值故指在α=0.10的差异显着,判别有效。

3)计算各变量的贡献值

地球化学找矿

于是得

地球化学找矿

地球化学找矿

可见Ag的贡献很小,可舍去,只用作变量建立判别函数,可得同样效果。

4)对未知属性的样品进行判别

①计算判别临界值:

因NA=NB,故

地球化学找矿

所以

由上计算结果得:

R(A)>R0>R(B)故大于R0者属矿致异常;小于R0者属非矿致异常。

②计算未知属性异常的判别函数值:

将未知属性异常(C),Cu,Ag,Bi的对数含量值代入判别函数得:R(C)=0.2898×2.945-0.0646×2.147-0.4612×1.537=0.006

因为R(C)=0.006<R0=0.1982,故未知属性异常属非矿致异常。

‘捌’ 常用的判别分析方法有哪些

按照习惯大类分成化学分析法,电化学分析法和仪器分析法
1.化学分析里面包括滴定法(氧化还原滴定,酸碱滴定,络合滴定等),重量分析法等等
2.电化学分析里面包括循环伏安,极谱,电解等等方法
3.仪器分析就更多了,紫外可见分光光度法(UV-Vis),原子发射光谱法,色谱法(包括气相色谱GC,高效液相色谱HPLC),毛细管电泳(CE),核磁共振(NMR),X粉末多晶衍射(XRD),质谱(MS)等等

‘玖’ 线性判别分析是一种什么方法

线性判别分析是对费舍尔的线性鉴别方法的归纳,这种方法使用统计学,模式识别和机器学习方法,试图找到两类物体或事件的特征的一个线性组合,以能够特征化或区分它们。
线性判别的思想非常朴素,给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近,异样样例的投影点尽可能远离;在对新样本进行分类时,将其投影到同样的直线上,再根据投影点的位置来确定新样本的类别。
线性判别与方差分析和回归分析紧密相关,这两种分析方法也试图通过一些特征或测量值的线性组合来表示一个因变量。然而,方差分析使用类别自变量和连续数因变量,而判别分析连续自变量和类别因变量(即类标签)。逻辑回归和概率回归比方差分析更类似于LDA,因为他们也是用连续自变量来解释类别因变量的。

‘拾’ 判别分析的基本原理

是用于判别样品所属类型的一种统计分析方法,是根据表明事物特点的变量值和他们所属的类,求出判别函数,根据判别函数对未知所属类别的食物进行分类的一种分析方法。

阅读全文

与判别分析是什么方法相关的资料

热点内容
说话与沟通的方法有哪些 浏览:624
招聘谈钱技巧和方法 浏览:8
怎么补色最快的方法 浏览:380
痛风解决方法有哪些 浏览:363
门牌调换最佳方法 浏览:21
什么方法快速消红 浏览:665
如何运用文学批评方法 浏览:497
小米手机5s输入法在哪里设置方法 浏览:442
通信网络优化的常用方法 浏览:774
数据分析包含哪些方法 浏览:613
88打六折怎么计算方法 浏览:338
藏香的使用方法 浏览:711
41的竖式计算方法 浏览:944
如何快速选择有效的治疗方法 浏览:919
centos安装软件的方法 浏览:288
挂衣架安装方法和步骤 浏览:908
乙肝表抗定量检测方法 浏览:604
戒酒什么方法最快 浏览:336
拉力测试仪使用方法 浏览:245
电子放大镜使用方法 浏览:971