1、描述统计
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析、离中趋势分析和相关分析三大部分。
2、假设检验
参数检验:参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。
3、信服分析
介绍:信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。
信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。
2. 统计学方法有哪些
一、描述统计
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
集中趋势分析:集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?
离中趋势分析:离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。例如,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分差或百分点来比较。
相关分析:相关分析探讨数据之间是否具有统计学上的关联性。这种关系既包括两个数据之间的单一相关关系——如年龄与个人领域空间之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系;既包括A大B就大(小),A小B就小(大)的直线相关关系,也可以是复杂相关关系(A=Y-B*X);既可以是A、B变量同时增大这种正相关关系,也可以是A变量增大时B变量减小这种负相关,还包括两变量共同变化的紧密程度——即相关系数。实际上,相关关系唯一不研究的数据关系,就是数据协同变化的内在根据——即因果关系。获得相关系数有什么用呢?简而言之,有了相关系数,就可以根据回归方程,进行A变量到B变量的估算,这就是所谓的回归分析,因此,相关分析是一种完整的统计研究方法,它贯穿于提出假设,数据研究,数据分析,数据研究的始终。
例如,我们想知道对监狱情景进行什么改造,可以降低囚徒的暴力倾向。我们就需要将不同的囚舍颜色基调、囚舍绿化程度、囚室人口密度、放风时间、探视时间进行排列组合,然后让每个囚室一种实验处理,然后用因素分析法找出与囚徒暴力倾向的相关系数最高的因素。假定这一因素为囚室人口密度,我们又要将被试随机分入不同人口密度的十几个囚室中生活,继而得到人口密度和暴力倾向两组变量(即我们讨论过的A、B两列变量)。然后,我们将人口密度排入X轴,将暴力倾向分排入Y轴,获得了一个很有价值的图表,当某典狱长想知道,某囚舍扩建到N人/间囚室,暴力倾向能降低多少。我们可以当前人口密度和改建后人口密度带入相应的回归方程,算出扩建前的预期暴力倾向和扩建后的预期暴力倾向,两数据之差即典狱长想知道的结果。
推论统计:
推论统计是统计学乃至于心理统计学中较为年轻的一部分内容。它以统计结果为依据,来证明或推翻某个命题。具体来说,就是通过分析样本与样本分布的差异,来估算样本与总体、同一样本的前后测成绩差异,样本与样本的成绩差距、总体与总体的成绩差距是否具有显着性差异。例如,我们想研究教育背景是否会影响人的智力测验成绩。可以找100名24岁大学毕业生和100名24岁初中毕业生。采集他们的一些智力测验成绩。用推论统计方法进行数据处理,最后会得出类似这样儿的结论:“研究发现,大学毕业生组的成绩显着高于初中毕业生组的成绩,二者在0.01水平上具有显着性差异,说明大学毕业生的一些智力测验成绩优于中学毕业生组。”
其中,如果用EXCEL 来求描述统计。其方法是:工具-加载宏-勾选"分析工具库",然后关闭Excel然后重新打开,工具菜单就会出现"数据分析"。描述统计是“数据分析”内一个子菜单,在做的时候,记得要把方格输入正确。最好直接点选。
2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。
二、假设检验
1、参数检验
参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。
1)U验 :使用条件:当样本含量n较大时,样本值符合正态分布
2)T检验 使用条件:当样本含量n较小时,样本值符合正态分布
A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别;
B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;
C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。
2、非参数检验
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。
适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。
A 虽然是连续数据,但总体分布形态未知或者非正态;
B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。
三、信度分析
介绍:信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。
方法:(1)重测信度法编辑:这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。
(2)复本信度法编辑:让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。
(3)折半信度法编辑:折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表(李克特量表(Likert scale)是属评分加总式量表最常用的一种,属同一构念的这些项目是用加总方式来计分,单独或个别项目是无意义的。它是由美国社会心理学家李克特于1932年在原有的总加量表基础上改进而成的。该量表由一组陈述组成,每一陈述有"非常同意"、"同意"、"不一定"、"不同意"、"非常不同意"五种回答,分别记为5、4、3、2、1,每个被调查者的态度总分就是他对各道题的回答所得分数的加总,这一总分可说明他的态度强弱或他在这一量表上的不同状态。)。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式:求出整个量表的信度系数(ru)。
(4)α信度系数法编辑:Cronbach
α信度系数是目前最常用的信度系数,其公式为:
α=(k/(k-1))*(1-(∑Si^2)/ST^2)
其中,K为量表中题项的总数, Si^2为第i题得分的题内方差, ST^2为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。
总量表的信度系数最好在0.8以上,0.7-0.8之间可以接受;分量表的信度系数最好在0.7以上,0.6-0.7还可以接受。Cronbach 's alpha系数如果在0.6以下就要考虑重新编问卷。
检査测量的可信度,例如调查问卷的真实性。
分类:
1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度
2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。
四、列联表分析
列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。
简介:一般,若总体中的个体可按两个属性A、B分类,A有r个等级A1,A2,…,Ar,B有c个等级B1,B2,…,Bc,从总体中抽取大小为n的样本,设其中有nij个个体的属性属于等级Ai和Bj,nij称为频数,将r×c个nij排列为一个r行c列的二维列联表,简称r×c表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。
列联表又称交互分类表,所谓交互分类,是指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。
用于分析离散变量或定型变量之间是否存在相关。
列联表分析的基本问题是,判明所考察的各属性之间有无关联,即是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在r×с表中,若以pi、pj和pij分别表示总体中的个体属于等级Ai,属于等级Bj和同时属于Ai、Bj的概率(pi,pj称边缘概率,pij称格概率),“A、B两属性无关联”的假设可以表述为H0:pij=pi·pj,(i=1,2,…,r;j=1,2,…,с),未知参数pij、pi、pj的最大似然估计(见点估计)分别为行和及列和(统称边缘和)
为样本大小。根据K.皮尔森(1904)的拟合优度检验或似然比检验(见假设检验),当h0成立,且一切pi>0和pj>0时,统计量的渐近分布是自由度为(r-1)(с-1) 的Ⅹ分布,式中Eij=(ni·nj)/n称为期望频数。当n足够大,且表中各格的Eij都不太小时,可以据此对h0作检验:若Ⅹ值足够大,就拒绝假设h0,即认为A与B有关联。在前面的色觉问题中,曾按此检验,判定出性别与色觉之间存在某种关联。
需要注意:
若样本大小n不很大,则上述基于渐近分布的方法就不适用。对此,在四格表情形,R.A.费希尔(1935)提出了一种适用于所有n的精确检验法。其思想是在固定各边缘和的条件下,根据超几何分布(见概率分布),可以计算观测频数出现任意一种特定排列的条件概率。把实际出现的观测频数排列,以及比它呈现更多关联迹象的所有可能排列的条件概率都算出来并相加,若所得结果小于给定的显着性水平,则判定所考虑的两个属性存在关联,从而拒绝h0。
对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。
列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。
五、相关分析
研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。
1、单相关: 两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量;
2、复相关 :三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关;
3、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。
六、方差分析
使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。
分类
1、单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系
2、多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系
3、多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系
4、协方差分祈:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分祈结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法,
七、回归分析
分类:
1、一元线性回归分析:只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
2、多元线性回归分析
使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。
1)变呈筛选方式:选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法
2)横型诊断方法:
A 残差检验: 观测值与估计值的差值要艰从正态分布
B 强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法
C 共线性诊断:
• 诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例
• 处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等
3、Logistic回归分析
线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况
分类:
Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。
4、其他回归方法 非线性回归、有序回归、Probit回归、加权回归等
八、聚类分析
聚类与分类的不同在于,聚类所要求划分的类是未知的。
聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多着名的统计分析软件包中,如SPSS、SAS等。
从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。
定义:
依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。
各类事物缺乏可靠的历史资料,无法确定共有多少类别,目的是将性质相近事物归入一类。
各指标之间具有一定的相关关系。
聚类分析(cluster
analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。聚类分析区别于分类分析(classification
analysis) ,后者是有监督的学习。
变量类型:定类变量、定量(离散和连续)变量
样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量。
1、性质分类:
Q型聚类分析:对样本进行分类处理,又称样本聚类分祈使用距离系数作为统计量衡量相似度,如欧式距离、极端距离、绝对距离等
R型聚类分析:对指标进行分类处理,又称指标聚类分析使用相似系数作为统计量衡量相似度,相关系数、列联系数等
2、方法分类:
1)系统聚类法:适用于小样本的样本聚类或指标聚类,一般用系统聚类法来聚类指标,又称分层聚类
2)逐步聚类法:适用于大样本的样本聚类
3)其他聚类法:两步聚类、K均值聚类等
九、判别分析
1、判别分析:根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体
2、与聚类分析区别
1)聚类分析可以对样本逬行分类,也可以对指标进行分类;而判别分析只能对样本
2)聚类分析事先不知道事物的类别,也不知道分几类;而判别分析必须事先知道事物的类别,也知道分几类
3)聚类分析不需要分类的历史资料,而直接对样本进行分类;而判别分析需要分类历史资料去建立判别函数,然后才能对样本进行分类
3、进行分类 :
1)Fisher判别分析法 :
以距离为判别准则来分类,即样本与哪个类的距离最短就分到哪一类,适用于两类判别;
以概率为判别准则来分类,即样本属于哪一类的概率最大就分到哪一类,适用于
适用于多类判别。
2)BAYES判别分析法 :
BAYES判别分析法比FISHER判别分析法更加完善和先进,它不仅能解决多类判别分析,而且分析时考虑了数据的分布状态,所以一般较多使用;
十、主成分分析
介绍:主成分分析(Principal
Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
主成分分析首先是由K.皮尔森(Karl Pearson)对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
将彼此梠关的一组指标变适转化为彼此独立的一组新的指标变量,并用其中较少的几个新指标变量就能综合反应原多个指标变量中所包含的主要信息。
原理:在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。
缺点: 1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。
2、主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。
十一、因子分析
一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法
与主成分分析比较:
相同:都能够起到治理多个原始变量内在结构关系的作用
不同:主成分分析重在综合原始变适的信息.而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法
用途:
1)减少分析变量个数
2)通过对变量间相关关系探测,将原始变量进行分类
十二、时间序列分析
动态数据处理的统计方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题;时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。
主要方法:移动平均滤波与指数平滑法、ARIMA横型、量ARIMA横型、ARIMAX模型、向呈自回归横型、ARCH族模型
时间序列是指同一变量按事件发生的先后顺序排列起来的一组观察值或记录值。构成时间序列的要素有两个:其一是时间,其二是与时间相对应的变量水平。实际数据的时间序列能够展示研究对象在一定时期内的发展变化趋势与规律,因而可以从时间序列中找出变量变化的特征、趋势以及发展规律,从而对变量的未来变化进行有效地预测。
时间序列的变动形态一般分为四种:长期趋势变动,季节变动,循环变动,不规则变动。
时间序列预测法的应用:
系统描述:根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述;
系统分析:当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理;
预测未来:一般用ARMA模型拟合时间序列,预测该时间序列未来值;
决策和控制:根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制。
特点:
假定事物的过去趋势会延伸到未来;
预测所依据的数据具有不规则性;
撇开了市场发展之间的因果关系。
①时间序列分析预测法是根据市场过去的变化趋势预测未来的发展,它的前提是假定事物的过去会同样延续到未来。事物的现实是历史发展的结果,而事物的未来又是现实的延伸,事物的过去和未来是有联系的。市场预测的时间序列分析法,正是根据客观事物发展的这种连续规律性,运用过去的历史数据,通过统计分析,进一步推测市场未来的发展趋势。市场预测中,事物的过去会同样延续到未来,其意思是说,市场未来不会发生突然跳跃式变化,而是渐进变化的。
时间序列分析预测法的哲学依据,是唯物辩证法中的基本观点,即认为一切事物都是发展变化的,事物的发展变化在时间上具有连续性,市场现象也是这样。市场现象过去和现在的发展变化规律和发展水平,会影响到市场现象未来的发展变化规律和规模水平;市场现象未来的变化规律和水平,是市场现象过去和现在变化规律和发展水平的结果。
需要指出,由于事物的发展不仅有连续性的特点,而且又是复杂多样的。因此,在应用时间序列分析法进行市场预测时应注意市场现象未来发展变化规律和发展水平,不一定与其历史和现在的发展变化规律完全一致。随着市场现象的发展,它还会出现一些新的特点。因此,在时间序列分析预测中,决不能机械地按市场现象过去和现在的规律向外延伸。必须要研究分析市场现象变化的新特点,新表现,并且将这些新特点和新表现充分考虑在预测值内。这样才能对市场现象做出既延续其历史变化规律,又符合其现实表现的可靠的预测结果。
②时间序列分析预测法突出了时间因素在预测中的作用,暂不考虑外界具体因素的影响。时间序列在时间序列分析预测法处于核心位置,没有时间序列,就没有这一方法的存在。虽然,预测对象的发展变化是受很多因素影响的。但是,运用时间序列分析进行量的预测,实际上将所有的影响因素归结到时间这一因素上,只承认所有影响因素的综合作用,并在未来对预测对象仍然起作用,并未去分析探讨预测对象和影响因素之间的因果关系。因此,为了求得能反映市场未来发展变化的精确预测值,在运用时间序列分析法进行预测时,必须将量的分析方法和质的分析方法结合起来,从质的方面充分研究各种因素与市场的关系,在充分分析研究影响市场变化的各种因素的基础上确定预测值。
需要指出的是,时间序列预测法因突出时间序列暂不考虑外界因素影响,因而存在着预测误差的缺陷,当遇到外界发生较大变化,往往会有较大偏差,时间序列预测法对于中短期预测的效果要比长期预测的效果好。因为客观事物,尤其是经济现象,在一个较长时间内发生外界因素变化的可能性加大,它们对市场经济现象必定要产生重大影响。如果出现这种情况,进行预测时,只考虑时间因素不考虑外界因素对预测对象的影响,其预测结果就会与实际状况严重不符。
3. 什么是集中趋势分析
集中趋势在统计学中是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
4. 数据分析的基本方法有哪些
数据分析的三个常用方法:
1. 数据趋势分析
趋势分析一般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户数等。做出简单的数据趋势图,并不算是趋势分析,趋势分析更多的是需要明确数据的变化,以及对变化原因进行分析。
趋势分析,最好的产出是比值。在趋势分析的时候需要明确几个概念:环比,同比,定基比。环比是指,是本期统计数据与上期比较,例如2019年2月份与2019年1月份相比较,环比可以知道最近的变化趋势,但是会有些季节性差异。为了消除季节差异,于是有了同比的概念,例如2019年2月份和2018年2月份进行比较。定基比更好理解,就是和某个基点进行比较,比如2018年1月作为基点,定基比则为2019年2月和2018年1月进行比较。
比如:2019年2月份某APP月活跃用户数我2000万,相比1月份,环比增加2%,相比去年2月份,同比增长20%。趋势分析另一个核心目的则是对趋势做出解释,对于趋势线中明显的拐点,发生了什么事情要给出合理的解释,无论是外部原因还是内部原因。
2. 数据对比分析
数据的趋势变化独立的看,其实很多情况下并不能说明问题,比如如果一个企业盈利增长10%,我们并无法判断这个企业的好坏,如果这个企业所处行业的其他企业普遍为负增长,则5%很多,如果行业其他企业增长平均为50%,则这是一个很差的数据。
对比分析,就是给孤立的数据一个合理的参考系,否则孤立的数据毫无意义。在此我向大家推荐一个大数据技术交流圈: 658558542 突破技术瓶颈,提升思维能力 。
一般而言,对比的数据是数据的基本面,比如行业的情况,全站的情况等。有的时候,在产品迭代测试的时候,为了增加说服力,会人为的设置对比的基准。也就是A/B test。
比较试验最关键的是A/B两组只保持单一变量,其他条件保持一致。比如测试首页改版的效果,就需要保持A/B两组用户质量保持相同,上线时间保持相同,来源渠道相同等。只有这样才能得到比较有说服力的数据。
3. 数据细分分析
在得到一些初步结论的时候,需要进一步地细拆,因为在一些综合指标的使用过程中,会抹杀一些关键的数据细节,而指标本身的变化,也需要分析变化产生的原因。这里的细分一定要进行多维度的细拆。常见的拆分方法包括:
分时 :不同时间短数据是否有变化。
分渠道 :不同来源的流量或者产品是否有变化。
分用户 :新注册用户和老用户相比是否有差异,高等级用户和低等级用户相比是否有差异。
分地区 :不同地区的数据是否有变化。
组成拆分 :比如搜索由搜索词组成,可以拆分不同搜索词;店铺流量由不用店铺产生,可以分拆不同的店铺。
细分分析是一个非常重要的手段,多问一些为什么,才是得到结论的关键,而一步一步拆分,就是在不断问为什么的过程。
5. 社会调查集中趋势分析是什么意思能否举个例子
集中趋势分析是用各种起代表值作用的量度来反映变量数值趋向中心位置的一种资料分析方法。在正常状态下,一些现象有趋向于中心位置的情况,这种趋向于集中的均衡形态,是自然界的一种平衡现象。所以,在对研究资料的分析中,如果能够了解一种趋向于中心位置的数值,就可用它来代表此项资料的一般情况。而对这一中心值的测度即为集中量的测度。
如一项研究显示了某地学龄前儿童平均每天看3.5时左右的电视。假如把这一数值用于集中趋势的测度,它就可以代表该地任何一个学龄前儿童每天花费在电视上的时间。对现象进行集中趋势测度的方法主要有众数、中位数、几何平均数、调合平均数和算术平均数等。
6. 4、简述集中趋势分析的作用与缺陷
一、趋势线
1、所谓趋势线,就是根据股价上下变动的趋势所画出的线路,画趋势线的目的,即依其脉络寻找出恰当的卖点与买点。趋势线可分为上升趋势线,下降趋势线与横向整理趋势线。
2、股价在上升行情时,除了在连接股价波动的低点画一直线外,也应在连接股价波动的高点画一直线,于是股价便在这两条直线内上下波动,这就是上升趋势轨道。股价在下跌行情时,除了连接股价波动的高点画一直线外,也要在股价波动的低点画一条直线,股价在这两条直线内上下波动,这就是下跌趋势轨道。股价在横向整理时可形成横向箱型趋势线。
二、利用趋势轨道决定买卖点
1、无论是在上升或下跌趋势轨道中,当股价触及上方的压力线时,就是卖出的时机;当股价触及下方的支撑线时,就是买进的时机。
2、若在上升趋势轨道中,发现股价突破上方的压力线时,证明新的上升趋势线即将产生。
3、同理,若在下跌趋势中,发现股价突破下方的支撑线时,可能新的下跌趋势轨道即将产生。
4、股价在上升行情时,一波的波峰会比前一波峰高,一波的波谷会比前一波谷高;而在下跌行情时,一波的波峰比前一波峰低,一波的的波谷会比前一波谷低。
5、处于上升趋势轨道中,若发现股价无法触及上方的压力线时,即表示涨势趋弱了。
三、几种趋势分析
1、上升趋势分析
股价上升趋势线是指股价上升波段中, 股价底部之连接线而言, 这连接而成之上升趋势线通常相当规则, 在上升趋势线的股价波动上画一条与上升趋势线平行的线, 这条平行线又称返回线。
【买卖点分析】
(1)在股价上升趋势中,当股价下跌而触及股价上升趋势线时,便是绝佳的买点(买进信号),投资者可酌量买进股票。
(2)当股价上升而触及股价上升趋势线之返回线时,便是股票绝佳之卖点(卖出信号),投资者可将手中的持股卖掉。
(3)上升趋势的波段分析认为:上升分三波段, 每一波段上升幅度皆同,投资者可以等幅测量,比如第一波由45元上升至60元,拉回50元,第二波由50元上升至65元,拉回55元,第三波可上升至65元左右。
【行情分析】
一个多头行情主要由原始、次级或短期上升波动所组成,股价一波比一波高,每两个底部低点即可连成一条上升趋势线。一般而言,原始上升趋势线较为平缓,历经时间较长,而次级或短期上升趋势线较为陡峭,其历经时间有时甚短。
(1)原始上升趋势线:一般多头市场的原始上升趋势线的建立往往历经相当长时间(短则一二年长则四五年)的波动, 其上升仰角较小, 约为30°~45°。
(2)短期上升趋势线:指多头市场之各次级滚动,以各波之底部低点为基准点向上延伸,其经历之时间较短,一般为数日或数周。其上升仰角较陡,约为45°~60°,有时甚至在60度角以上(尤其在多头市场初期最易出现)。
(3)上升趋势线之支撑与压力:在股价上升趋势中,遇到以往密集成交区或其他阻力位,在某个股价价位上,卖压很大,足以阻止股价上升,或进行使上升走势的股价反转下跌,这种情况便是股逢压力。
2、整理趋势分析
矩形整理在股市亦称为箱形整理。股价在某一价格区间上下移动,移动轨道由两条平行于横轴的平行线所界定,其形状就像几何图形的矩形或长方形。
箱形整理形态通常出现在股价上升走势或下跌走势的初期或中期,若箱形出现在股价上升走势或下跌走势之末期,往往形成反转形态,而非整理形态。
(1)箱形整理形态一般在股价上升波完成或下跌波完成之后出现。 (2)成交量配合箱形整理的完成,起初大量而逐步萎缩,一直到股价突破箱形整理为止。(3)股价最迟必须在三至四周内按预定的方向突破。
向上突破初期时箱形向上平移;向下跌破时箱形向下平移,暴涨暴跌的情况除外。若不符合上述特征,箱形整理有可能失败而成为箱形反转。
3、下降趋势分析
(1)下跌趋势线之形成:一个空头行情是由原始,次级或短期下跌波动所构成,股价一波比一波低,每两个反弹之高点即可连成一条下跌趋势线,一般而言,原始下跌趋势线较为平缓,经历时间较长,而次级或短期下跌趋势线较为陡峭,其经历时间有时甚短。
原始下跌趋势线:一般空头市场的原始下跌趋势线经历的时间较原始上升趋势线为短,约为一至二年,其下降之角度较为平缓约为30°~45°。
趋势理论的缺陷:
一、趋势理论主要目标乃探讨股市的基本趋势(PrimaryTrend)。一旦基本趋势确立,趋势理论假设这种趋势会一路持续,直到趋势遇到外来因素破坏而改变为止。好像物理学里牛顿定律所说,所有物体移动时都会以直线发展,除非有额外因素力量加诸其上。但有一点要注意的是,趋势理论只推断股市的大势所趋,却不能推动大趋势里面的升幅或者跌幅将会达到哪个程度。
二、趋势理论每次都要两种指数互相确认,这样做已经慢了半拍,走失了最好的进货和出货机会。
三、趋势理论对选股没有帮助。
四、趋势理论注重长期趋势,对中期趋势,特别是在不知是牛还是熊的情况下,不能带给投资者明确启示。
7. 综合分析方法
综合分析方法是以遥感填图方法为主,同时结合地球物理、岩石同位素资料进行综合分析,建立划分填图单元的一种方法。其应用的目的在于使填图单元建立划分的更加准确,地质信息提取的更加丰富,并从不同角度解决填图问题。
(一)遥感填图方法
影像单元法、影像岩石单元和单元-剖面法是贯穿遥感填图全过程的方法技术。运用这些方法是从遥感技术角度解决1∶25 万填图的技术问题,使填图成果精度符合相应的技术规范要求。其解决填图问题的实质是通过研究、分析不同性质地质体的宏观影像分区及微观影像变化规律,进行地质体性质判定和填图单位种类划分及构造信息的提取与类型划分。它们所能够解决的地质问题或地质现象均属于地球表面的直接显示出的信息,即表层信息提取。但对于大量的隐伏地质信息的提取,受其方法技术自身限制难以全面实现,如隐伏断裂和隐伏岩体及花岗岩类侵入体的时代等等。因此,结合其他技术方法的应用,从不同角度,取长补短,丰富地质填图成果,使其更加符合地质作用规律。
(二)地球物理技术方法
该方法是遥感地质填图综合分析研究的首选技术方法。主要通过地球物理资料如航磁、重力处理数据的分析、解释,并根据地质体的磁性特征、密度特征变化规律,着重解决隐伏断裂、隐伏岩体和火山机构的圈定。解决遥感技术和物探技术在1∶25万遥感地质填图应用中解释地质问题的层次和深度。现以内蒙古得尔布干覆盖地区和新疆阿尔金裸露地区为例加以叙述。
1.内蒙古得尔布干地区重磁场特征分析
1)岩石磁性特征分析
通过2000年6~9月,对阿龙山地区进行的岩石磁性测量工作,其中实地测量了岩石露头27处,获得磁化率数据327个;测量岩石标本712块,获得磁化率数据2872个。区内岩石(地层)的磁性特征如下。
(1)变质岩类磁性特征
区内出露的元古宇变质岩岩性为花岗岩片麻岩、黑云斜长变粒岩、片岩及千枚岩、大理岩等。磁测定结果反映出元古宇地层的磁性普遍很弱,磁化率值变化范围在(0~380)×10-5SI,平均值仅为60×10-5SI。
(2)盖层磁性特征
阿龙山地区的盖层主要为一套中生界火山岩地层,该套地层的磁性特征如下。
火山碎屑岩类一般为弱磁性或具有中等磁性。其中凝灰砂岩、层凝灰岩及含角砾凝灰岩的磁性普遍很弱,磁化率的平均值多在(30~65)×10-5SI之间变化;熔结凝灰岩和英安质、粗安质及安山质凝灰岩的磁性多具有中等磁性,磁化率变化范围在(11~1661)×10-5SI之间,最大可达到3890×10-5SI,平均磁化率值为570×10-5SI。
中性—基性火山熔岩一般具有很强的磁性,其中粗安岩的磁化率在(15~3390)×10-5SI之间,平均值为886×10-5SI;英安岩的磁化率变化范围在(0~4000)×10-5SI之间,平均值在(590~3000)×10-5SI之间;安山岩的磁化率值范围在(1228~3360)×10-5SI之间,平均值为3012×10-5SI;玄武岩磁化率变化范围在(394~10000)×10-5SI之间,磁化率均值为2281×10-5SI。
(3)侵入岩磁性特征
区内花岗岩类的磁性差异较大,其中花岗岩的磁性可分为无磁性花岗岩、弱磁性花岗岩及中等磁性花岗岩。无磁性花岗岩磁化率平均值为40×10-5SI;弱磁性花岗岩平均磁化率为230×10-5SI;中等磁性花岗岩的磁化率变化在(11~1177)×10-5SI之间,磁化率均值为695×10-5SI。花岗斑岩类一般具有中等磁性,磁化率变化范围一般在(19~1311)×10-5SI之间,磁化率均值为545×10-5SI。二长花岗岩和钾长花岗岩的磁化率在(13~3000)×10-5SI之间,磁化率均值为630×10-5SI。因此,除了无磁性的花岗岩外,其他类型的花岗岩类引起的磁异常较难区分。
区内闪长岩类的磁性一般比花岗岩类强度大,其中花岗闪长岩、石英闪长岩的磁化率值范围在(126~3500)×10-5SI之间,平均值为950×10-5SI;闪长玢岩的平均磁化率达1286×10-5SI;闪长岩的磁化率值范围在(614~6300)×10-5SI之间,磁化率平均值可达1900×10-5SI。
2)岩石密度特征分析
阿龙山地区岩石及地层密度变化具有以下特征:
(1)随着地层的时代由新至老岩石的密度值逐渐增大;
(2)中生界侏罗系火山熔岩地层的岩石密度值比正常碎屑岩类的岩石密度值大;
(3)下古生界与元古宇的岩石密度值基本相同,中性、酸性侵入岩体的岩石密度则介于侏罗系火山熔岩地层与前中生界(包括下古生界和元古宇)之间,其密度差值约在±0.15 g/cm3左右。因此,该地区区域性密度界面是前中生界和中、酸性侵入岩构成的岩石界面,该区域性密度界面与上覆盖层之间存在着0.2~0.7 g/cm3密度差;侏罗系火山熔岩与正常碎屑岩是区内的局部密度界面。其间存在0.5 g/cm3密度差(表2-4)。
表2-4 阿龙山及周边地区岩石密度统计表
3)重磁场特征及解释
阿龙山地区的航磁资料测量比例尺大,飞行高度低,测量精度高,编绘出的ΔT磁场图件包含的各类地质信息非常丰富。
根据已知地质资料与岩石物性资料对比分析结果,得出如下结论:
(1)阿龙山地区海西期花岗岩与下古生界和元古宇构成了该地区重要的区性岩石磁性界面及岩石密度界面。中元古界和下古生界磁性很弱,仅海西期花岗斑岩和二长花岗岩及花岗闪长岩、闪长岩具有中等与较强的磁性。
(2)阿龙山地区区域背景磁场的特征及分布,主要反映区域磁性界面强弱变化与分布特点,降低的负磁场区为下古生界、元古宇及弱磁性的海西期花岗岩分布区;升高的正背景磁异常区则为具磁性的海西期中、酸性侵入岩分布区。
(3)航磁局部磁异常一般是花岗闪长岩、闪长岩和中、基性火山熔岩及浅成次火山岩,如安山玢岩、闪长玢岩、英安岩等引起。其中花岗闪长岩和闪长岩等引起的局部磁异常形态清晰并且强度较大,比较容易辨认。
(4)由于火山岩(主要是熔结凝灰岩和中、基性火山熔岩)和浅成次火山岩很不均匀,它们所引起的磁异常在形态和强度变化方面都较大,其分布特点一般呈带状、环状及片状分布。
(5)不同时代岩石、地层的密度变化具有十分明显的规律性,构成该地区区域性密度界面的元古宇、下古生界及海西期侵入岩体与中生界地层之间存在着0.2~0.7 g/cm3密度差。因此,阿龙山地区布格重力图中局部重力异常场的高、低变化应是主密度界面起伏变化或侏罗纪中、基性火山岩的客观反映。
4)磁场特征及分区
阿龙山地区的磁场特征及变化十分复杂,为了便于对磁场和磁异常的分类及研究,依据该地区的区域背景磁场及磁异常的性质、形态、强度及梯度变化,以及它们之间的组合分布特点等,划分为三类:
(1)独立正磁异常及编号
HA-Ⅰ:该类磁异常的形态呈等轴状或似等轴状,有些异常具有一定的延伸及走向。异常形态规整,强度一般大于500 nT,面积一般大于2.0 km2。
HA-Ⅱ:该类磁异常的形态特征与前述磁异常相同,但磁异常的强度比前者弱,异常的强度一般在200~500 nT之间。
推断上述磁异常主要是由具磁性的中、酸性侵入岩体引起,对岩体范围的圈定起参考作用。
(2)正背景磁场的分区及编号
a.HB类磁场区特征及编号
该类磁异常的明显特点是强度较大,一般在200~500 nT之间。依据磁异常的形态特征、发育程度及组合分布特点,划分出3个磁场小区:
HB-Ⅰ:小区内磁异常发育,磁异常的形态以似二度异常为主,即单个磁异常具有明显的延伸及走向,并且没有明显的负值伴生。
HB-Ⅱ:小区内磁异常的形态及强度特征与前述小区相类似,主要差别仅仅是局部磁异常的发育程度比前者差一些。
HB-Ⅲ:小区内磁异常的形态与强度变化比较复杂,既存在着等轴状及似等轴状异常,同时也发育有二度及似二度异常,并且局部磁异常存在着明显的伴生负值。
b.HC类磁场区特征及编号
该类磁场小区内磁异常形态特征与HB类小区基本相同,它们之间的显着差异主要反映在磁异常的强度方面,该类磁场小区内的磁异常强度变化在100~250 nT之间。
HC-Ⅰ:区内磁异常形态以二度和似二度异常为主,异常发育,强度在 100~250 nT之间。
HC-Ⅱ:小区内磁异常形态多以等轴状和似等轴状异常为主,并存在着明显的伴生负值,异常强度一般在100~250 nT之间。
HC-Ⅲ:小区内局部异常较发育,但磁异常的强度比 HC-Ⅱ磁场小区磁异常弱,磁异常强度变化在50~100 nT之间。
HC-Ⅳ:小区内局部磁异常不发育,区内正磁场变化平缓单调,强度在50~100 nT左右。
该类磁场小区主要反映的是中、基性火山熔岩及次火山岩类的变化与分布特点,可对填图单位组、段划分对比起到参考作用。
(3)负背景磁场分区及编号
a.LA类磁场小区特征及编号
该类磁场小区内局部磁异常发育程度及变化较大,负背景磁场变化平缓,磁场值在-50~-150 nT之间。
LA-Ⅰ:小区内的局部磁异常不发育,负背景磁变化平缓、单调,磁场强度在 0~-100 nT之间。
LA-Ⅱ:小区的负背景磁场强度变化在 0~-100 nT之间,局部磁异常较前磁场小区发育,但局部异常强度较弱,异常幅值变化在50~100 nT之间。
LA-Ⅲ:小区内背景磁场变化在-50~-150 nT之间,局部异常发育,异常的幅值变化一般在50~200 nT之间。
LA-Ⅳ:小区内背景磁场强度变化在-100~-150 nT之间,局部磁异常发育且强度较大,异常幅值变化一般在200~500 nT之间。
b.LB类磁场小区特征及编号
与LA类磁场小区相比较,LB类磁场小区的主要特点是背景磁场强度明显偏弱,背景磁场强度值一般在-200 nT以上。结合该类磁场区内局部异常发育程度及特征,可分为如下次级小区。
LB-Ⅰ:小区内的背景磁场强度在-200~-250 nT之间,其变化特征平缓、单调,区内局部异常不发育。
LB-Ⅱ:小区内背景磁场强度可达-300 nT以上,局部磁异常较发育,异常幅值变化在50~150 nT之间变化。
LB-Ⅲ:小区内背景磁场强度变化在-150~-250 nT之间。局部磁异常发育,其幅值变化在100~250 nT之间,并存在着明显的伴生负值。
该类磁场小区主要反映的是火山碎屑岩类夹沉积岩分布特点。其中小区内不同强度的局部异常则反映了次火山岩的存在及发育状况,可为填图单位、岩石大类划分提供参考作用。
5)断裂构造及重、磁异常特征
断裂构造在重、磁场图中反映出的标志特征十分明显,它们反映出的重、磁场标志特征主要有:不同性质重、磁场区及不同特征重、磁异常区之分界线;重、磁场线性梯度带;线性重、磁异常带或串珠状线性重、磁异常带;串珠状线性重、磁异常带和重、磁异常带之错动或扭动线等。
6)侏罗系地层厚度及分布特征
通过前面岩石、矿物的磁性特征分析可知,阿龙山地区的前中生界是该地区的区域性岩石密度界面,它与上覆侏罗系之间存在着0.2~0.7 g/cm3的密度差。因此,局部重力场的变化主要反映了区域性密度界面起伏及侏罗系地厚的厚度变化等信息,局部重力高一般是基岩隆起或凸起的反映,局部重力低则反映出基岩凹陷的分布特点。据此,通过对重力局部异常进行深度计算并结合已知地质资料,编制出阿龙山地区侏罗系地层厚度分布图。由于使用的重力资料比例尺小、精度低,深度计算误差可能在±20.0%左右。
阿龙山地区侏罗系的厚度变化及分布特点反映基岩起伏变化呈现出凹隆相间分布的构造格局,其宏观走向呈北东向展布。即阿南-阿北林场凹陷,秀山-汗马基站隆起,乌力依特林场-防火站凹陷。阿南-阿北林场凹陷的沉积中心位于阿北林场附近,侏罗系地层厚度可达1.5 km,向南有逐渐减薄的趋势;乌力依特林场-防火站凹陷存在着两个沉积中心,即乌力依特林场沉积中心和防火站沉积中心,沉积中心内侏罗系地层的厚度可达2.0 km,在两沉积中心之间被一个次级基岩凸起隔开。此外,在约安里林场和源江林场等处,还分别存在着两个侏罗系地层厚度达2.0 km和1.5 km的沉积中心。
7)火山机构群及分布特征
阿龙山地区侏罗系火山岩地层分布广、厚度大,说明该地区在中生代时期曾发生过强烈的岩浆喷溢活动,火山机构广泛发育。我们知道,在岩浆喷溢过程中靠近火山口处不但堆积了巨厚的火山熔岩,而且也是次火山岩比较集中发育的地段,这就为利用航磁圈定火山机构提供了可靠的地质前提条件。岩石磁性测定结果证明,阿龙山地区的火山熔岩和次火山岩一般都具有较强的磁性,具备了利用航磁圈定火山机构的地球物理前提条件。航磁资料结合已知地质资料分析对比结果表明,火山机构在磁场上具有明显的磁异常反映,一般中心喷发式的火山机构引起的磁异常形态呈等轴状或似等轴状,既有正磁异常也有(因近体磁化原因引起的)负磁异常;裂隙溢出式的火山机构引起的磁异常形态多呈二度磁异常及磁异常带。磁异常的强度及大小主要与火山熔岩及次火山岩的磁性强弱及规模大小有关,一般中、基性火山熔岩及安山玢岩、辉长、辉绿玢岩、闪长玢岩等引起的磁异常强度较大,中、酸性火山熔岩及英安岩引起的磁异常相对较弱。上述与火山机构有关的磁异常在阿龙山地区一般呈带状或片状群出现,为我们研究分析该地区火山机构群类型及分布提供了重要依据。
依据火山机构群表现出的磁场特征在阿龙山工区共圈定出火山机构群22处。区内火山机构群的规模大小及分布具有以下特点:以内蒙古得尔布干断裂为界其北侧的火山机构群规模一般较小,并且具有明显的延伸及走向,反映出火山机构明显地受断裂所控制。另外,各火山机构群内单个火山机构反映出的磁异常形态主要是以等轴状或似等轴状异常为主,说明得尔布干断裂西北侧的火山活动主要是以中心喷发式为主。分布在得尔布干断裂东南侧的火山机构群规模一般较大,其形态多为片状,各火山机构群内单个火山机构的磁异常形态变化比较复杂,既存在着等轴状及似等轴状磁异常,也存在着具有一定延伸和走向的二度磁异常及磁异常带,反映出得尔布干断裂东南侧火山活动形式既存在着中心喷发式,同时也存在着裂隙溢出式的岩浆活动,而且次火山岩比较发育。说明在得尔布干断裂东南侧火山机构非常发育,岩浆的喷、溢活动强烈。
重力资料反映,区内的火山机构群主要分布在重力高异常(或异常带)与重力低异常(或异常带)的转换部位,上述部位恰是基底断裂所通过的位置。
2.新疆阿尔金地区磁场特征分析
由于阿尔金山地区只有1∶50 万航磁资料,受其精度所限,对该地区的研究,设想从区域性航磁磁场分区、区域磁场和局部异常分析三个方面入手,解决沉积岩地层,沉积-火成岩地层、变质岩地层、花岗岩类侵入体的空间分布与宏观影像岩石单元间的关系;解决构造轮廓及区域构造格架,以及隐伏岩体与单元的关系。具体分析内容及方法如下:
1)岩石磁性特征
区内基性、超基性侵入体具有很强的磁性,因此该类侵入体一般可以引起较强的磁异常。经过与已知地质资料分析对比,阿尔金山地区不同时代的基性或超基性岩体均有明显的磁异常反映。如出露在研究区内的石棉矿(东经88°30′、北纬38°20′)超基性岩体、辉长岩体(东经87°10′、北纬38°05′;东经88°25′、北纬38°10′)都存在着明显的局部磁异常与之对应。受基性、超基性岩体规模的限制,该类岩体所引起的磁异常规模及强度变化较大,其形态一般呈等轴状或似轴状,强度一般在150~200 nT,最大可达500 nT以上(茫崖镇岩体)。
中、酸性侵入体引起的磁异常一般呈等轴状或似等轴状,异常的规模一般比基性、超基性岩体引起的磁异常规模大,强度一般在100~200 nT。
由火山岩引起的磁异常形态一般具有二度异常及线状异常带特征,说明区内火山分布受断裂控制。
2)磁场分区及地质解析
依据瓦石峡幅航磁ΔT磁场图中区域磁场表现出的(正、负)外貌特征及强度、梯度变化,以及次级叠加磁异常的形态特征与发育程度,将该区划分为如下4个次级磁场小区。
Ⅰ宽缓变化负磁场区;
Ⅱ宽缓变化正、负磁场区;
Ⅲ叠加局部磁异常的负磁场区;
Ⅳ条带状正、负变化磁场区。
岩石磁性资料结合地质资料分析结果表明,阿尔金山地区存在着两个十分明显的磁性界面。其中区内的太古宇—元古宇变质基底构成了该地区的区域性磁性界面,该磁性界面所引起的区域背景磁场具有较好的稳定性和连续性。区内另外一个磁性界面则是由不同时期的岩浆侵入体或火山岩等所构成的局部磁性界面,由于该磁性界面的稳定性与连续性都很差,因此它们所引起的磁(场)异常一般表现出很大的差异与离散性。上述局部磁性界面所产生的形态各异和强度多变的磁异常叠加分布在区域背景磁场中,这样就使得磁场的形态及外貌特征变得复杂起来。
阿尔金山地区太古宙中的强磁性变质岩主要是由正变质岩构成,其原岩主要为中、基性的岩浆岩类;太古宙副变质岩一般具有弱磁性或不具磁性。阿尔金山地区元古宇地层中也分布有具有磁性的变质岩系,但其磁性强度要比太古宇中的强磁性变质岩弱很多,说明以上两类变质岩在原岩性质及物质成分上存在着较大差别,推断具有中等磁性的元古宇变质岩类其原岩多为中、酸性岩浆岩,或者是在变质过程中混入了中、酸性岩浆岩成分。因此,阿尔金山(瓦石峡地区区域背景磁场特征及分布主要是揭示出了该地区结晶基底的岩性,即基底岩相变化。升高的正磁场和强度很大的正背景磁异常分布区反映为强磁性正变质岩分布区;降低的负磁场区则为副变质岩(Ⅰ:宽缓变化负磁场区,Ⅲ:叠加局部磁异常的负磁场区)分布区;在降低的负磁场中所显示出的升高磁场区(Ⅳ:条带状正、负变化磁场区)为中等磁性变质岩分布区。叠加在区域背景磁场中的局部磁异常或磁异常带主要是不同时期的岩浆侵入体和火山岩的反映,它们的分布特点及发育程度揭示出了瓦石峡地区在断裂及岩浆活动方面存在的差异。例如在Ⅰ、Ⅱ号磁场小区内的局部磁异常很不发育,说明瓦石峡幅西北部的岩浆活动特别是海西运动以来的岩浆活动对该地区的影响甚微;在Ⅲ磁场小区可以看到局部异常较发育,局部异常的形态一般为等轴状或似等轴状,磁异常的强度一般也比较弱。推断该磁场小区内的局部异常主要为中、酸性侵入体引起,反映出Ⅲ号磁场小区的岩浆活动方式是以侵入活动为主;Ⅳ号磁场小区内的局部异常非常发育,并且异常的强度及形态变化也表现得十分复杂,揭示出该小区的岩浆活动比较强烈、频繁,不同时期的岩浆成分及性质差异较大,并且岩浆活动方式也十分复杂,既存在着岩浆侵入活动,同时也存在着规模较大的岩浆喷溢活动。所以,瓦石峡研究区的磁场特征及分布,深刻地揭示出了该地区的基底结构与岩相分布特征,以及岩浆活动特点等情况。
3)基底断裂及特征
研究结果证明,断裂在磁场上一般具有以下几种标志特征:
(1)不同性质(正、负)磁场区及不同形态磁异常区分界线;
(2)磁场线性梯度带;
(3)线性正(或负)磁异常带及串珠状线性磁异常带;
(4)磁场与磁异常带的错(或扭)动带。
断裂在磁场上所表现出的上述特征标志对我们分析、判断断裂规模及性质具有十分重要的意义。其标志特征表现为不同性质磁场区或不同形态磁异常区分界线的断裂,不但对基底结构及岩相分布具有控制作用,而且反映断裂两侧的岩浆活动也具有较大差异,说明断裂的规模大并对区域地质发展及构造演化起到控制作用;反映为线性磁异常带或串珠状线性异常带等磁场标志特征的断裂,则说明沿着断裂有岩浆侵入体和火山岩分布,揭示出该类断裂一般切割的深度大,对岩浆活动具有控制作用;表现出磁场或线性磁异常带的错动带标志特征的断裂,则为我们提供了断裂两侧曾发生过相对运动的有关信息。
总之,断裂在磁场上所表现出的特征标志是比较复杂的,它可以表现出一种磁场标志特征,也可以同时反映出两种或两种以上的标志特征。
3.遥感与航磁成果吻合性影响因素分析
遥感地质解译与航磁解释成果经常表现出诸多的不一致性,主要表现在同一地质体的形态、位态的不同。究其原因表现在以下几个方面:
1)遥感和航磁资料的多解性
地质体在特定条件下会存在异物同(光)谱(或同谱异物)和位场等效效应现象,这是造成遥感及航磁解译(释)结果呈现出非惟一性,即多解性的原因。多解性现象的存在不但增大了资料解释的工作量与难度,而且还可能会造成解释结果中某些不确定因素同时增多。遥感和航磁成果中存在着的不确定因素往往会对两者成果之间的对比分析造成困难,并对成果的吻合性产生明显的影响,因此,遥感与航磁技术方法本身及成果中所存在的多解性问题,往往是引起两者的解释成果在吻合性(一致性)方面存在差别的主要影响因素之一。
2)成果解译(释)理论、方法方面存在的差异
遥感与航磁的成果解译(释)理论和方法方面存在的差别及其对成果吻合性影响包括两个方面:
(1)研究及实践结果证明,依据解译(释)理论及方法所获得的遥感与航磁成果在没有得到野外检查验证之前都是推断性成果。因此,解译(释)成果本身与实际情况之间所存在的不确定性,将会影响到遥感与航磁成果的吻合性(一致性)。
(2)目前正在广泛使用的遥感与航磁的成果解译(释)理论和方法是一套各自完全独立的工作系统,两者之间不存在任何的内在联系。遥感技术具有直观性和可视性等特点,有利于资料的对比分析,这样就使得遥感解译成果中的推断性成分较少。相比之下,航磁资料解释,特别是在对磁异常进行定量解释过程中,必须给出磁化强度的大小、方向及磁性体的形状等参数,而上述参数在一般情况下都是通过试验及分析对比或是逻辑推理方法确定的,造成航磁成果中的推断分析成分所占的比重相对较大。因此,遥感与航磁的成果解译(释)方法之间存在的差异,是影响遥感与航磁成果吻合性的主要因素之一。
3)地质体的复杂性
地表所保留的地质体是长期、复杂地质作用的结果。它们对遥感与航磁成果吻合性的影响及其产生的原因主要与技术方法本身的特点有关。研究及分析结果表明,对于复杂的地质及构造现象,不同的技术方法一般只能够揭示出它们的某一个侧面。例如,对一条深大断裂,遥感资料可以依据断裂显示的地形、地貌特征、色调和影纹等的差异,可以很直观地揭示出该断裂在地表的位置及延伸方向。而航磁则是依据断裂磁场特点(多反映为线性磁异常带或串珠状线性磁异常带)来判断出断裂的延深及展布。由于受断裂控制的磁性体(一般为岩浆岩类)的分布情况比较复杂,它们的宏观展布方向虽然与断裂的走向一致,但它们并不一定在断裂之中,而是往往沿着断裂带及其两侧排列分布,说明航磁资料中还包含有反映断裂的深部信息的成分。从而造成遥感资料反映出的断裂和航磁资料圈定出的断裂在平面位置上存在着一定的偏离现象。因此,宏观地质体的复杂性也是影响遥感与航磁成果吻合性的重要因素之一。
(三)同位素测年资料
同位素测年资料是确定地质体形成时代或年龄的依据。它可通过收集前人资料获取,也可通过同位素样品采集分析获取。无论采用哪种方式收集,均有利于花岗岩类侵入体填图单元年龄和断裂形成年龄的判定。测年方法比较多,有U/Pb法、Rb/Sr法、K/Ar法、40Ar/39Ar法、14C法、电子自旋共振(ESR)法等。
铀-铅法根据238U/206Pb和235U/207Pb衰变进行测年,其样品一般采用晶质铀矿或沥青铀矿、锆石、独居石等。
铷-锶法根据87Rb/87Sr的β衰变进行测年。这种方法可广泛地利用全岩进行测定,除富含铷的矿物外,还可以利用钾长石、云母类矿物和铷含量为10-2%~10-3%的酸性岩。
钾-氩法和氩-氩法测年可以采用的矿物较多。包括钾长石类、云母类、角闪石类、辉石类和海绿石等。
14C法利用炭质粘土岩类和植物等样品进行测年。
在使用上述不同方法测年数据时,应注意数据适用性。
总之,遥感地质解译与航磁地质解释资料的综合分析利用是遥感地质填图成果的丰富、补充与相互验证,由于这两种方法技术揭示地质体层次不同,即遥感以表层地质现象为主,航磁以深部地质结构为主,所以在解释结果利用过程中应视具体情况具体分析。一般情况下,对第四纪覆盖区的隐伏断裂解译及利用局部异常圈定隐伏侵入岩体,航磁解释优于遥感解译结果,图面地质内容应以航磁解译结果为主体。但对于填图单元解译划分,裸露区断裂解译,应以遥感技术为主体,充分发挥其直观、宏观技术特性。而航磁ΔT异常分区分析与遥感宏观影像单元分区具有相应的结合性,可通过磁场分区强度判定岩类范围。对同位测年数据主要与影像岩石单元结合,采用定位对比或直接使用以确保单元建立划分合理,序列归并准确。
8. 常用统计分析方法
数据分析师针对不同业务问题可以制作各种具体的数据模型去分析问题,运用各种分析方法去探索数据,这里介绍最常用的三种分析方法,希望可以对您的工作有一定的的帮助
文中可视化图表均使用DataFocus数据分析工具制作。
1.相关分析
相关分析显示变量如何与另一个变量相关。例如,它显示了计件工资是否会带来更高的生产率。
2.回归分析
回归分析是对一个变量值与另一个变量值之间差异的定量预测。回归模拟依赖变量和解释变量之间的关系,这些变量通常绘制在散点图上。您还可以使用回归线来显示这些关系是强还是弱。
另请注意,散点图上的异常值非常重要。例如,外围数据点可能代表公司最关键供应商或畅销产品的输入。但是,回归线的性质通常会让您忽略这些异常值。
3.假设检验
假设检验是基于某些假设并从样本到人口的数理统计中的统计分析方法。主要是为了解决问题的需要,对整体研究提出一些假设。通常,比较两个统计数据集,或者将通过采样获得的数据集与来自理想化模型的合成数据集进行比较。提出了两个数据集之间统计关系的假设,并将其用作理想化零假设的替代方案。建议两个数据集之间没有关系。
在掌握了数据分析的基本图形和分析方法之后,数据分析师认为有一点需要注意:“在没有确认如何表达你想要解决的问题之前,不要开始进行数据分析。”简而言之,如果您无法解释您试图用数据分析解决的业务问题,那么没有数据分析可以解决问题。
9. 如何分析股票筹码集中度
你好,股票筹码集中度可以这么看:
1、通过上市公司的报表,如果上市公司股本结构简单,只有国家股和流通股,则前10名持股者中大多是持有流通股,有两种判断方法:一将前10名中所持的流通股累加起来,看掌握了多少,这种情况适合分析机构的介入程度。二是推测10名以后的情况,有人认为假如最后一名持股量不低于
0.5%则可判断该股筹码集中度较为集中,但庄家有时亦可做假,他保留前若干名股东的筹码,如此以来,就难以看出变化,但有一点可以肯定,假如第10名持股占流通股低于0.2%,则后面更低,则可判断集中度低。
2、通过公开信息制度,股市每天都公布当日涨跌幅超过7%的个股的成交信息,主要是前五个成交金额最大的营业部或席位的名称和成交金额数,如果某股出现放量上涨,则公布的大都是集中购买者。如果放量下跌,则公布大都是集中抛售者。这些资料可在电脑里查到,或于报上见到。假如这些营业部席位的成交金额也占到总成交金额的40%,即可判断有庄进出。
3、通过盘口和盘面来看,盘面是指K线图和成交量柱状图,盘口是指即时行情成交窗口,主力建仓有两种:低吸建仓和拉高建仓。低吸建仓每日成交量低,盘面上看不出,但可从盘口的外盘大于内盘看出,拉高建仓导致放量上涨,可从盘面上看出,庄家出货时,股价往口萎靡不振,或形态刚好就又跌下来,一般是下跌时都有量,可明显看出。
4、如果某只股票在一两周内突然放量上行,累计换手率超过100%,则大多是庄家拉高建仓,对新股来说,如果上市首日换手率超过70%或第一周成交量超过100%,则一般都有新庄入驻。
5、如果某只股票长时间低位徘徊(一般来说时间可长达4-5个月),成交量不断放大,或间断性放量,而且底部被不断抬高,则可判断庄家已逐步将筹码在低位收集。应注意的是,徘徊的时间越长越好,这说明庄家将来可赢利的筹码越多,其志在长远。
风险揭示:本信息不构成任何投资建议,投资者不应以该等信息取代其独立判断或仅根据该等信息作出决策,不构成任何买卖操作,不保证任何收益。如自行操作,请注意仓位控制和风险控制。
10. 教育学中归纳分析的主要方法有哪些
错误句型归纳分析
反意疑问句
归纳分析、语法真题重点归纳.分析.
修辞法归纳分析
(一)教育研究资料的整理——1.含义:
资料整理
是指运用科学的方法,将调查所得的原始资料按调查目的进行审核、汇总与初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程;2.意义:是对调查资料的全面检查;是进一步分析研究资料的基础;是保存资料的客观要求;3.资料整理的步骤:①审核,确保资料的质量,真实性,准确性和完整性;②分类;是整理的核心工作;确定
分组标志
,进行整理和统计;③汇总,把分散的资料集中起来;(二)教育研究资料的定量分析——1.概念:主要采用
数学方法
(主要是
数理统计分析
),对获得的资料和研究结果进行统计、分析和处理,以揭示所研究事物和现象的数量关系,掌握数量特征和数量变化,进而确定事物和现象的本质及其发展规律;2.定量分析的方法:①数据描述。主要用于特征分析,通过一些概括性量数来反映数据的全貌和特征;分为
集中量数
(如平均数、
中位数
和
众数
)、
差异量数
(
平均差
、方差和
标准差
)、地位量数(百分等级分数、
标准分数
、T分数)、
相关系数
;②数据推断。主要是用抽样的方式对样本进行研究,并从
样本统计量
对事物的总体做出统计的推论和估计;分为
参数估计
(
点估计和区间估计
)和
统计检验
;(三)教育研究资料的
定性分析
——1.概念:是对资料的质的
规定
性做整体分析,主要采用逻辑方法,同时还要求对分析结果的信度、效度和客观度等可靠性指标进行检验和评价,以便对研究对象有整体性、发展性和综合性的把握;2.过程:①按照研究课题的性质确定定性分析的目标及分析材料的范围;②对资料进行初步的检验分析;③选择适当的
定性分析方法
,确定分析的维度;④对资料进行归类分析;⑤对定性分析结果进行信度、效度和客观度的评价;3.定性分析的主要方法:因果分析、归纳分析、比较分析、系统分析;