1. 重、磁对应分析技术
利用重、磁异常对应分析方法,获得重、磁异常对应分析结果,推断对应分析结果中的低值区对应沉积地层可能性最大,是中生界分布的可能范围。该方法结果经综合地震资料对比分析,效果良好。
(一)方法原理
一个均匀磁化且密度均匀的物体,其磁位U和引力位V的解析式间存在以下关系:
海域油气资源战略调查与选区
从式中可以看出,磁位和引力位的方向导数存在简单的线性关系,可以推出化极磁异常与重力异常的垂向一阶导数亦存在此简单的线性关系。
根据上述原理,将化极磁力异常和基底布格重力异常(为自由空间重力数据经过海水校正并消除新生界影响后得到的重力数据)垂向一阶导数进行归一化处理,得出重、磁异常对应分析结果。在重磁异常对应分析结果中,低值区表现为重力低、磁力低,对应沉积地层可能性最大;高值区表现为重力高、磁力高,对应高磁性火成岩或基底隆起的可能性最大。据此结果,可以有效地综合分析研究区内的重、磁异常特征,并与其所反映的地质问题紧密结合。
(二)应用与效果
利用南海东北部卫星测高重力异常及航空磁力数据进行重、磁对应分析,首先对卫星重力数据进行海水校正并消除新生界影响,获得基底布格重力异常并对其作垂向一阶导数处理(图5-33),其次对航磁数据进行化极处理(图5-34),最后将基底布格重力异常与化极磁力异常进行归一化处理,获得重、磁对应分析结果图(图4-70)。
图5-33 基底布格重力异常垂向一阶导数图(等值线间距为0.1mGal/km)
通过定性分析重磁平面异常特征、重磁数据后续处理图件、重磁异常地质成因以及结合分析地震资料显示的地层结构,认为南海东北部海域中部北东向的基底布格重力低、化极磁力低区域,是我们探讨中生界分布的重点区域,大致呈两个带(图4-70):北带位于珠江口盆地北缘的北东向条带;南带位于珠江口盆地的白云凹陷经潮汕坳陷、台西南盆地北部,直至台湾陆区西部的北东向条带,圈划区内有众多地震剖面不同程度地揭示了中生界的存留。
图5-34 化极磁力异常等值线图(等值线间距为10nT)
2. 自适应重磁对应分析法
从前面的分析得知,重磁对应分析的根本目的在于了解重磁异常是否相关和是否同源,因此,主要应考虑重磁异常主体或异常源上方所在位置的对应分析参数,至于远离异常中心的地方,则没有必要再考虑对应分析参数的数值变化。传统重磁对应分析数据处理方法采用正方形窗口逐点滑动计算相关系数,在远离重磁异常中心或非重磁异常主体的地方,也求出了相关系数数值,而这些地方的数值没有实际意义,且给解释造成干扰。为了解决该问题,提出了自适应重磁对应分析方法。
所谓自适应重磁对应分析数据处理方法,就是根据异常的宽度和周围的干扰,自动调节重磁对应分析参数计算窗口大小的方法,其具体工作流程是:首先找到异常中心的位置;然后向四周搜索,寻找异常的边界,确定异常范围;接下来,再根据异常范围和事先给定的对计算窗口大小的要求,确定自适应重磁对应分析的计算窗口大小,并计算异常中心处的重磁对应分析的有关参数。
自适应重磁对应分析数据处理方法,通常应分别计算磁异常或重力异常中心处的重磁对应分析的有关参数。由于对重磁异常的处理方法相同,下面以磁△T化极异常为例,介绍自适应重磁对应分析的计算过程。
1.寻找磁异常中心的位置
利用一个正方形滑动窗口,逐点滑动寻找异常中心的位置。
假设某点的位置为(i,j),当该点处磁△T化极异常的数值△T⊥(i,j)满足下列条件时,则该点就是一个磁△T化极异常中心的位置:
晋冀北缘—辽西铁矿重要成矿带找矿靶区航磁优选
对于负异常,其中心的位置就是异常极小值点所在位置,其判断标志是窗口中心点的数值不大于周围点的数值。
2.寻找异常的边界
就重磁对应分析来说,所关心的是异常的主体部分。根据重磁异常特征,其主体部分的数值变化具有单调性(正异常为单调减小,负异常为单调增加)。因此,通过分析异常数值变化的单调性是否改变,即可找到异常主体的边界。具体讲,在找到磁△T化极异常中心的位置后,便以此为出发点,沿上下左右四个方向逐点进行搜索,寻找到异常数值变化单调性的改变点,即为异常主体的边界点。
假设点(i,j)为磁△T化极正异常中心的位置,在向左搜索的过程中,当某点(i-Dl,j)处磁△T 化极异常的数值△T⊥(i-Dl,j)满足条件△T⊥(i-Dl,j)≤△T⊥(i-Dl-1,j)时,则该点就是该磁△T化极正异常的左侧边界。同理,可以找到右侧边界(i+Dr,j)、下侧边界(i,j-Dd)和上侧边界(i,j+Du)。
对于负异常,只要将其判别条件作相应改变即可,如△T⊥(i-Dr,j)≥△T⊥(i-Dr-l,j)。
3.确定重磁对应分析参数计算窗口
重磁对应分析中影响计算结果质量的一个重要因素是计算窗口的大小:一方面,窗口尺寸要尽量大,以便尽可能包含足够的异常变化信息,如果窗口太小,没有包含足够的异常信息,则会因为信噪比低而造成所得的相关系数不准确;另一方面,窗口的尺寸要尽量小,以避开相邻异常的影响和减少深源异常的干扰,若窗口太大则包含其他异常的信息较多,使得相关系数的误差变大。因此,在开展重磁对应分析之前,应根据研究目标的大小和干扰的强弱,合理确定重磁对应分析参数计算窗口所允许的最小半边长Ln和最大半边长Lx。
对于某磁△T化极异常,如果其某方向的宽度小于Ln,则认为该异常属于干扰,不予计数重磁对应分析参数;如果其任意方向的宽度都大于Ln,则认为该异常属于有效异常,应计算重磁对应分析参数,矩形计算窗口的边长确定为Dl+Dr+1和Dd+Du+1,其中Dl、Dr、Dd和Du应小于或等于Lx。
4.计算重磁对应分析参数
根据第3步确定的计算窗口,采用式(3—3)计算相关系数R,并将其赋予磁△T化极正异常中心的位置(i,j)处。
5.判断重磁异常相关性
重磁异常相关性的判别方法,是根据计算重磁异常相关系数时的自由度n,查找给定显着性水平下的最小相关系数Rα,如果|R|大于等于Rα,则认为显着性相关,否则认为不相关。为了便于表达,定义相关程度p为
晋冀北缘—辽西铁矿重要成矿带找矿靶区航磁优选
式中:p为相关程度;R为计算的重磁异常相关系数;Rα为显着性水平α时的最小相关系数(表3-1)。
表3-1 相关系数显着性检验表
(据刘承柞等,1981)
判别重磁异常是否相关的条件为:
(1)p≥1,表示重力异常和磁异常属于显着性正相关;
(2)p≤-1,表示重力异常和磁异常属于显着性负相关;
(3)-1<p<1,表示重力异常和磁异常属于显着性不相关。
3. 大数据分析方法有哪些
1、因子分析方法
所谓因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难。因子分析的方法约有10多种,如影像分析法,重心法、最大似然法、最小平方法、α抽因法、拉奥典型抽因法等等。
2、回归分析方法
回归分析方法就是指研究一个随机变量Y对另一个(X)或一组变量的相依关系的统计分析方法。回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析方法运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
3、相关分析方法
相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一种非确定性的关系。
4、聚类分析方法
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,不需要事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。
5、方差分析方法
方差数据方法就是用于两个及两个以上样本均数差别的显着性检验。由于各种因素的影响,研究所得的数据呈现波动状。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显着影响的变量。
6、对应分析方法
对应分析是通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。
4. spss分析方法-对应分析(转载)
对应分析也称关联分析、R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法。 下面我们主要从下面四个方面来解说:
[if !supportLineBreakNewLine]
[endif]
实际应用
理论思想
建立模型
[if !supportLineBreakNewLine]
[endif]
分析结果
[if !supportLineBreakNewLine]
[endif]
一、实际应用
对应分析法 可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系 。当所涉及的 分类变量类别较多或者分类变量的个数较多 的时候,我们就需要用到对应分析。主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中。原因在于,它是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来。
[if !supportLineBreakNewLine]
[endif]
二、理论思想
由于指标型的因子分析和样品型的因子分析反映的是一个整体的不同侧面,因此它们之间一定存在内在的联系。如果能够有效利用这种内在联系所提供的信息,对更全面合理地分析数据具有很大的帮助。在因子分析中,如果研究的对象是样品,可采用Q型因子分析;如果研究的对象是变量,则需采用R型因子分析。但是,因为这两种因子分析方法必须分别对样品和变量进行处理,所以这两种分析方法往往存在着相互对立的关系,为我们发现和寻找它们的内在联系制造了困难。而对应分析通过一个过渡矩阵Z将两者有机地结合了起来。 对应分析的基本思想是将一个联列表的行和列中各元素的比例结构,以点的形式在较低维的空间中表示出来。 首先,给出指标变量点的协差阵A=Z,Z和样品点的协差阵B=ZZ’,由于两者有相同的非零特征根,所以可以很方便地借助指标型因子分析而得到样品型因子分析的结论。如果对每组变量选择前两列因子载荷,那么两组变量就可以画出两个因子载荷的散点图。由于这两个图所表示的载荷可以配对,于是就可以把这两个因子载荷的两个散点图画到同一张图中,并以此来直观地显示各行变量和各列变量之间的关系。
[if !supportLineBreakNewLine]
[endif]
三、建立模型
[if !supportLineBreakNewLine]
[endif]
数据条件:
[if !supportLists]§ [endif]不能用于相关关系的假设检验
对应分析案例:
[if !supportLineBreakNewLine]
[endif]
题目:费希尔在1940年首次介绍列联表资料时使用的是一份关于眼睛颜色与头发颜色的调查研究数据。该研究数据包含了5387名苏格兰北部的凯斯纳斯郡的小学生的眼睛颜色与头发颜色,如下表所示。试用对应分析方法研究眼睛颜色与头发颜色之间的对应关系。
一、数据输入
二、操作步骤 1、进入SPSS,打开相关数据文件,因为本例中是以频数格式录入数据的(相同取值的观测只录入一次,另加一个频数变量用于记录该数值共出现了多少次),所以进入SPSS后,首先要对数据进行预处理,以频数变量进行加权,从而将数据指定为该种格式。选择“数据”|“个案加权”命令。首先在“个案加权”对话框的右侧选中“个案加权系数”单选按钮,然后在左侧的列表框中选择“频数”进入“频率变量”列表框。单击“确定”按钮,完成数据预处理。
2、选择“分析”|“降维”|“对应分析”命令。先定义行变量及其取值范围,即在“对应分析”对话框的左侧选择“眼睛颜色”进入右侧的“行”列表框,然后单击下方的“定义范围”按钮,在“最小值”中输入“1”,“最大值”输入“4”,单击“更新”按钮,最后单击“继续”按钮返回“对应分析”对话框。利用同样的方法定义列变量及其取值范围。列变量选择“头发颜色”,设置“最小值”为“1”,“最大值”为“5”。
3、其余设置采用系统默认值即可。单击“确定”按钮,等待输出结果。
[if !supportLineBreakNewLine]
[endif]
四、结果分析
1、对应分析表下表是按照原始数据整理而成的行列表,反映的是眼睛颜色和头发颜色不同组合下的实际样本数。
2、对应分析摘要在下表中,第一列是维度,其个数等于变量的最小分类数减1,本例中的最小分类数是眼睛颜色的种类(为4类),所以维度是3;第2~5列分别表示奇异值、惯量、卡方值和显着性;随后的列给出了各个维度所能解释的两个变量关系的百分比,容易发现,前两个维度就累计解释了99.6%的信息。
3
、对应分析坐标值及贡献值下表给出了行变量(眼睛颜色)和列变量(头发颜色)在各个维度上的坐标值,以及各个类别对各维数的贡献值。以本表上部分概述行点为例,对表中各列含义做一下简要说明。 “ 数量”列表示各种类别的构成比 ,如深色眼睛的人占总数的构成比例是0.244。 “维得分”列表示各类别在相关维数上的评分 ,首先给出的是默认提取的两个维数上各类别的因子负荷值。 “惯量”列给出了总惯量(0.23)在行变量中的分解情况,数值越大表示该类别对惯量的贡献越大。“点对维的惯量”表示在各个维数上,信息量在各类别间的分解状况 ,本例中第一维数主要被深色、蓝色、浅色所携带,也就是说这3个类别在第一维数上的区分比较好,第二维数主要被深色、棕色、蓝色所携带,说明这3个类别在第二维数上的区分比较好。 “维对点的惯量”表示各类别的信息在各维数上的分布比例 ,本例中深色、蓝色、浅色都主要分布在第一维数上,棕色主要分在第二维数上。 “总计”表示各维数的信息比例之和 ,可见红色这一类别在前两位中只提出了80.3%的信息,效果最差。
4、对应分析图下表是对应分析图,是对应分析中最主要的结果,从图中可以看出两个变量不同类别之间的关系。我们可以从两个方面来阅读本图:一方面可以分别从横坐标和纵坐标方向考察变量不同类别之间的稀疏,如果靠得近,则说明在该维数上这些类别之间差别不大;另一方面可以把平面划分为以(0,0)为原点的4个象限,位于相同象限的不同变量的分类点之间的关联较强。容易发现本例中:棕色头发和棕色眼睛,深色头发、黑色头发和深色眼睛,金色头发和蓝色眼睛、浅色眼睛存在着比较强的联系。
分析结论: 通过分析,我们可以知道:由结果分析1可知,眼睛颜色和头发颜色在不同组合下的实际样本数。由结果分析2可知,提取的前两个维数累计就已解释了99.6%的信息。由结果分析3可知,眼睛颜色和头发颜色在各个维数上的坐标值,以及各个类别对各个维数的贡献值。由结果分析4可知,棕色头发和棕色眼睛,深色头发、黑色头发和深色眼睛,金色头发和蓝色眼睛、浅色眼睛存在着比较强的联系。
(获取更多知识,前往 gz 号程式解说)
原文来自 https://mp.weixin.qq.com/s/Bt4IzRvcDRAtHKUtmuO57w
5. 数据分析算研究方法吗
对于数据分析师来说,懂得更多的数据分析方法是很有必要的,而且数据分析师工作工程中会根据变量的不同采用不同的数据分析方法,一般常用的数据分析方法包括聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析等,我们要学会使用这些数据分析之前一定要懂得这些方法的定义是什么。
第一先说因子分析方法,所谓因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难。因子分析的方法约有10多种,如影像分析法,重心法、最大似然法、最小平方法、α抽因法、拉奥典型抽因法等等。
第二说一下回归分析方法。回归分析方法就是指研究一个随机变量Y对另一个(X)或一组变量的相依关系的统计分析方法。回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析方法运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
接着说相关分析方法,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一种非确定性的关系。
然后说聚类分析方法。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,不需要事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。
接着说方差分析方法。方差数据方法就是用于两个及两个以上样本均数差别的显着性检验。由于各种因素的影响,研究所得的数据呈现波动状。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显着影响的变量。
最后说一下对应分析方法。对应分析是通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。