一个产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。数据说到底,就是这样一个工具——通过数据,我们可以衡量产品,可以了解产品,可以在数据驱动下改进产品。数据分析和数据处理本身是一个非常大的领域,这里主要总结一些我个人觉得比较基础且实用的部分,在日常产品工作中可以发挥比较大作用。
本文主要讨论一些数据分析的三个常用方法:
1. 数据趋势分析
趋势分析一般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户数等。做出简单的数据趋势图,并不算是趋势分析,趋势分析更多的是需要明确数据的变化,以及对变化原因进行分析。
趋势分析,最好的产出是比值。在趋势分析的时候需要明确几个概念:环比,同比,定基比。环比是指,是本期统计数据与上期比较,例如2019年2月份与2019年1月份相比较,环比可以知道最近的变化趋势,但是会有些季节性差异。为了消除季节差异,于是有了同比的概念,例如2019年2月份和2018年2月份进行比较。定基比更好理解,就是和某个基点进行比较,比如2018年1月作为基点,定基比则为2019年2月和2018年1月进行比较。
比如:2019年2月份某APP月活跃用户数我2000万,相比1月份,环比增加2%,相比去年2月份,同比增长20%。趋势分析另一个核心目的则是对趋势做出解释,对于趋势线中明显的拐点,发生了什么事情要给出合理的解释,无论是外部原因还是内部原因。
2. 数据对比分析
数据的趋势变化独立的看,其实很多情况下并不能说明问题,比如如果一个企业盈利增长10%,我们并无法判断这个企业的好坏,如果这个企业所处行业的其他企业普遍为负增长,则5%很多,如果行业其他企业增长平均为50%,则这是一个很差的数据。
对比分析,就是给孤立的数据一个合理的参考系,否则孤立的数据毫无意义。在此我向大家推荐一个大数据技术交流圈: 658558542 突破技术瓶颈,提升思维能力 。
一般而言,对比的数据是数据的基本面,比如行业的情况,全站的情况等。有的时候,在产品迭代测试的时候,为了增加说服力,会人为的设置对比的基准。也就是A/B test。
比较试验最关键的是A/B两组只保持单一变量,其他条件保持一致。比如测试首页改版的效果,就需要保持A/B两组用户质量保持相同,上线时间保持相同,来源渠道相同等。只有这样才能得到比较有说服力的数据。
3. 数据细分分析
在得到一些初步结论的时候,需要进一步地细拆,因为在一些综合指标的使用过程中,会抹杀一些关键的数据细节,而指标本身的变化,也需要分析变化产生的原因。这里的细分一定要进行多维度的细拆。常见的拆分方法包括:
分时 :不同时间短数据是否有变化。
分渠道 :不同来源的流量或者产品是否有变化。
分用户 :新注册用户和老用户相比是否有差异,高等级用户和低等级用户相比是否有差异。
分地区 :不同地区的数据是否有变化。
组成拆分 :比如搜索由搜索词组成,可以拆分不同搜索词;店铺流量由不用店铺产生,可以分拆不同的店铺。
细分分析是一个非常重要的手段,多问一些为什么,才是得到结论的关键,而一步一步拆分,就是在不断问为什么的过程。
4. 小结
趋势,对比,细分,基本包含了数据分析最基础的部分。无论是数据核实,还是数据分析,都需要不断地找趋势,做对比,做细分,才能得到最终有效的结论。
在此我向大家推荐一个大数据开发交流圈:
658558542 ( ☛点击即可加入群聊 )
里面整理了一大份学习资料,全都是些干货,包括大数据技术入门,大数据离线处理、数据实时处理、Hadoop 、Spark、Flink、推荐系统算法以及源码解析等,送给每一位大数据小伙伴,让自学更轻松。这里不止是小白聚集地,还有大牛在线解答!欢迎初学和进阶中的小伙伴一起进群学习交流,共同进步!
最后祝福所有遇到瓶颈的大数据程序员们突破自己,祝福大家在往后的工作与面试中一切顺利
1、分解主题分析
所谓分解主题分析,是指对于不同分析要求,我们可以初步分为营销主题、财务主题、灵活主题等,然后将这些大的主题逐步拆解为不同小的方面来进行分析。
2、钻取分析
所谓钻取分析,是指改变维的层次,变换分析的粒度。按照方向方式分为:向上和向下钻取。向上钻取是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;是自动生成汇总行的分析方法。向下钻取是从汇总数据深入到细节数据进行观察或增加新维的分析方法。
3、常规比较分析
所谓常规比较分析,是指一般比较常见的对比分析方法,例如有时间趋势分析、构成分析、同类比较分析、多指标分析、相关性分析、分组分析、象限分析等。
4、大型管理模型分析
所谓大型管理模型分析,是指依据各种成熟的、经过实践论证的大型管理模型对问题进行分析的方法。比较常见的大型管理模型分析包括RCV模型、阿米巴经营、品类管理分析等。
5、财务和因子分析
所谓财务和因子分析,主要是指因子分析法在财务信息分析上的广泛应用。因子分析的概念起源于20世纪初的关于智力测试的统计分析,以最少的信息丢失为前提,将众多的原有变量综合成较少的几个综合指标,既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失,达到有效的降维。比较常用的财务和因子分析法有杜邦分析法、EVA分析、财务指标、财务比率、坪效公式、品类公式、流量公式等。
6、专题大数据分析
所谓专题大数据分析,是指对特定的一些规模巨大的数据进行分析。大数据常用来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。常见特征是数据量大、类型繁多、价值密度低、速度快、时效低。比较常见的专题大数据分析有:市场购物篮分析、重力模型、推荐算法、价格敏感度分析、客户分组分析等分析方法。
‘叁’ 数据分析的6种常用方法
常见的6种数据分析的方法有: 直接判断法、对比分析法、结构分析法、平均分析法、漏斗分析法、因果分析法
无需经过任何的数据对比,根据经验直接进行判断。
这种方法对人的要求极高,要求个人对于数据和市场的理解都极其透彻,没有深度沉淀较长时间是做不到的,否则就成了武断。
把数据与过去N次进行对比,常见的对比类型有:竞争对手对比、时间同比与环比、类比对比、转化对比、特征和属性对比、前后变化对比的等等。
对比分析法在分析中使用频率是最高的,因为很多数据只有在对比中才能得出好坏、析出问题。
常见分析术语:
达成: 本月实际完成销售额与目标业绩的对比。达成是用于获取当前业绩的完成进度,评估业绩完成进度是否合理。业绩达成了,原因是什么?因为什么地方足够好?业绩不达成,原因又是什么?什么地方出现问题?
同比: 本月实际完成业绩与去年同月时期的对比。同比是用于看当前业绩和去年同期业绩相比有没有增长。这是做增长的运营者关注的重要指标。同比上升了,要看上升幅度有没有符合预期,同比下降了,要重点看下降的原因。
环比: 本月实际完成的业绩与上月实际完成业绩的对比。环比是用于看企业业绩前后变化,如试行新的运营策略一个月后与前一个月进行对比,看运营策略是否有效,但是这需要排除其他导致数据异常的原因。
差异: 自身完成业绩与竞争对手完成业绩的对比。差异是用于寻找企业与同行的产品不同之处,有时是为了避开直接竞争,有时候是为了学习同行优秀之处。
注: 对比分析法要注意控制变量,尽可能保持单一变量的对比,其他条件需要保持一致,这样的数据对比才有意义。
组内数据与总体数据之间进行对比。
常见如电商流量结构,自然搜索流量占总体的比例,付费流量占总体的比例,个性化推荐占总体的比例等等。
设置一个平均线,分析数据高于或者低于平均值的原因。
观察流程中每一步的转化和流失。常见如电商转化漏斗:展现——点击——访问——咨询——下单——支付等,每一步都设置数据埋点,观察用户行为数据,对跳失较高的步骤进行优化,提升产品功能、促销策略、服务体验等。
用枝状结构画出因果关系的图表,把影响因素一一列出,形成因果对应,有利于制定合理的方案。
‘肆’ 数据分析的分析方法有哪些
数据分析的分析方法有:
1、列表法
将数据按一定规律用列表方式表达出来,是记录和处理最常用的方法。表格的设计要求对应关系清楚,简单明了,有利于发现相关量之间的相关关系;此外还要求在标题栏中注明各个量的名称、符号、数量级和单位等:根据需要还可以列出除原始数据以外的计算栏目和统计栏目等。
2、作图法
作图法可以最醒目地表达各个物理量间的变化关系。从图线上可以简便求出实验需要的某些结果,还可以把某些复杂的函数关系,通过一定的变换用图形表示出来。
图表和图形的生成方式主要有两种:手动制表和用程序自动生成,其中用程序制表是通过相应的软件,例如SPSS、Excel、MATLAB等。将调查的数据输入程序中,通过对这些软件进行操作,得出最后结果,结果可以用图表或者图形的方式表现出来。
图形和图表可以直接反映出调研结果,这样大大节省了设计师的时间,帮助设计者们更好地分析和预测市场所需要的产品,为进一步的设计做铺垫。同时这些分析形式也运用在产品销售统计中,这样可以直观地给出最近的产品销售情况,并可以及时地分析和预测未来的市场销售情况等。所以数据分析法在工业设计中运用非常广泛,而且是极为重要的。
(4)对一维数据而言使用什么分析方法扩展阅读:
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。
‘伍’ 数据分析方法有哪些
常用的数据分析方法有:聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析。
1、聚类分析(Cluster Analysis)
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
2、因子分析(Factor Analysis)
因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难。因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。
3、相关分析(Correlation Analysis)
相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。
4、对应分析(Correspondence Analysis)
对应分析(Correspondence analysis)也称关联分析、R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。
5、回归分析
研究一个随机变量Y对另一个(X)或一组(X1,X2,?,Xk)变量的相依关系的统计分析方法。回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。
6、方差分析(ANOVA/Analysis of Variance)
又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显着性检验。由于各种因素的影响,研究所得的数据呈现波动状。
想了解更多关于数据分析的信息,推荐到CDA数据认证中心看看,CDA(Certified Data Analyst),即“CDA 数据分析师”,是在数字经济大背景和人工智能时代趋势下,面向全行业的专业权威国际资格认证, 旨在提升全民数字技能,助力企业数字化转型,推动行业数字化发展。 “CDA 数据分析师”具体指在互联网、金融、零售、咨询、电信、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、 提供决策的新型数据分析人才。
‘陆’ 一维反应分析法
现代地震学理论指出:历史上具有地震活动的地区,将来还有发生地震的可能,地震破坏的程度与地震时地面运动的各种物理参数(如位移、速度、加速度、振幅、频率等)有着密切的关系,在同一地震活动的作用下,地面运动的各种物理参数随地貌、岩土层类型的不同而表现出很大的差异。一维反应分析法是数值分析法的一种,是从地震工程的角度对地基的地震反应作数值计算,以期预测地震时地面运动的物理参数与地震烈度来划分不同破坏程度的区段,为城市抗震防灾工作服务。
所谓地震反应是指一次强烈地震所激发的地震波到达地面后引起的地面运动。人们可通过地面的位差闹圆移反应、速度反应、加速度反应来研究此地震。通过仪器将地面振动记录下来,并通过电子计算机计算地震反应谱,即位移反应谱、速度反应谱和加速度反应谱,通过这些谱研究那些对建筑物有影响的地震波的特性,如地面最大位移、最大速度和最大加速度与地震动周期(频率)的关系等。
为了形象地说明地震反应谱的概念,图2-3-17给出了地震反应谱的模型。如图2-3-17(a)中所表明的,在同一振动台上,并排放着阻尼系数C 相同而固有周期T 不同的振子-单质点系,如果用某一地震加速度去摇晃这一振动台,也就是对这组质点系输入地震加速度,于是各质点系随着振动台的运动而摆动,表现出对输入加速度的反应。若把各质点的加速度反应波形记录下来(如图2-3-17(b)所示),则可看出,固有周期不同的振子,其振动不同,周期短的振动得快,周期长的则振动得慢;波形的振幅变化受输入加速度波形的支配,波形的周期与振子的固有周期接近。若从这些波形中找出最大的振幅,如图2-3-17(b)的(Amax)1、(Amax)2、(Amax)3。图2-3-17(c)中三个黑点分别与[T1,(Amax)1]、[T2,(Amax)2]和[T3,(Amax)3]相对应。如果在振动台上并排放上只是周期稍有不同的非常多的单质点系,则可在图2-3-17(c)上得出一条曲线,这条曲线就是最初输入的地震加速度的反应谱,叫做加速度反应谱。同理,如果测定的是单质点系的位移反应和速度反应,则同样能分别得到位移反应谱与速度反应谱。
图2-3-17 地震反应谱的模型说明
场地的地震反应的计算方法有几种,如有限单元法、集中质量法、一维反应分析法等,这里仅介绍较常用的一维反应分析法。这种方法在考虑地表层振动时认为:①地表土弯薯层界面和基岩面近于水平;②深部横波以竖直方向传播到地面,这是因为地震时最大烈度通常出现在震中区,而地震波中的横波对建筑物破坏最大,这时,多层土层的地震动问题就变成研究地震波垂直入射地表的一维问题(图2-3-18)。
用一维反应分析法作土层地震反应计算的的假想地震动加速度时间过程a(t)作傅立叶变换求出输入讯号的谱A(ω),即大体流程如图2-3-19所示[7]、[9]。首先,对未来
图2-3-18 地基n层平行层模型
地球物理勘探及地球化学勘探方法在城市建设中的应用
然后,在以上的假定条件下,计算地基的频率传递函数H(ω)[7]。所谓频率传递函数是指在频率域中土层入射波和基岩入射波的比,它反映了地基土层对基岩入射波的放大特性,即
地球物理勘探及地虚塌球化学勘探方法在城市建设中的应用
H(ω)是一个复函数,随频率而异。式中,An=ω/Vsn,ω为频率,Vsn为基岩的横波速度;Gn=
图2-3-19 计算土层地震反应的大体流程
再次,利用频率传递函数H(ω)与输入谱的积可算出输出谱A(ω),即
A0(ω)=A(ω)·H(ω)
最后,对输出谱A0(ω)作傅立叶逆变换,即
地球物理勘探及地球化学勘探方法在城市建设中的应用
则可得不同土层的加速度反应时间过程a0(t)。
同理,若输入的是地震动位移时间过程或速度时间过程,亦可得出不同土层的位移反应和速度反应时间过程。
下面以日本琦玉县为例[15] 地质矿产部地球物理地球化学勘查研究所,1983。日本工程物探译文集。
1.地基的地质分类
为进行地震小区划分首先搜集了境内7000个钻孔资料,但这些资料主要是东部平原区的,而且缺乏岩土动力性质的内容。为此,除在基岩区进行地质调查外,还选择了10个在地貌、地质上具有代表性的地点进行补充勘探,同时作标准贯入试验、PS测井、原状土实验室测试等工作。在此基础上,对4000km2的范围作网格划分,每个网格面积为1.1×0.9km2,平均有1~2个钻孔。然后,根据地貌、地质和岩土特性,将全区岩土层分为60种类型,除三种为基岩类型外,其余的构成57种模型,以柱状图形式列出,并绘制了地质剖面图和全区的地质图。
2.地基的工程地震分类
工程地震分类是以地震反应分析为基础进行的。图2-3-20是地基的地震反应计算流程图。首先用PS测井取得的地基物理参数建立原始模型,然后对此模型输入地震波形和初始加速度,作地震反应计算。考虑到横波速度、剪切模量(G)、阻尼比(h)与应变(γ)的依从关系(图2-3-21),尚需不断修改波速,逐步进行追踪模拟,直至前后计算值的变化小于10%为止,求得最终反应值。通过反应分析,计算出每一模型的频率传递谱H(ω)。按谱的形态特征和放大倍数划分出地基类型12种(图2-3-22),加上基岩类型的三种,一共划分出15种。
图2-3-20 地基的地震反应计算流程图
图2-3-21 刚性系数、阻尼比与应变的关系曲线
G 高-压力水平(泊松比v=10-6~10-2)下所取得的剪切模量
图2-3-22 H(ω)的分类
在进行地震反应分析时,首先要选择标准层。其次在选择地震反应分析的输入波形时,如果此波形是在基岩中得到的,则可直接用作输入波形,如果是在覆盖层上得到的,则按照记录波形处的地基条件,返回到基岩层的波形,作为输入波形。
3.计算基岩区的加速度
为选择对本区有影响的地震作为地震预测对象,在县内按经纬度10′×10′的网格计算网格内的速度V0值。
地球物理勘探及地球化学勘探方法在城市建设中的应用
式中,V0为假想地震引起地基移动的速度(m/s);M为震级,d为震源距(km)。
凡在县内引起V0> 0.3m/s的地震都应予以考虑。最后,选出三次地震,即东海地震(M=8.0)、南关东地震(M=7.9)、西琦玉地震(M=7.0)作为预测研究对象。对三个震源分别计算基岩加速度a,计算公式采用田村(1979)经验公式 国外地质勘探技术编辑部,1986。工程与水文物探专辑,国外地质勘探技术,专辑9。
地球物理勘探及地球化学勘探方法在城市建设中的应用
式中,K为场地改正系数。当场地为第三纪台地时,K=1;为基岩山地时,K=0.8;为洪积层时,K=1.3;为冲积层时,K=2.1;为软弱层时,K=2.5。
此公式适用范围是:
M< 5时,d=20~150km;
5≤M< 6时,d=70~250km;
6≤M< 7时,d=170~250km;
M≥7时,d=170~250km。
根据各网格计算出的基岩加速度编制出基岩加速度分布图。
图2-3-23 放大系数曲线
4.预测地面加速度和地震烈度
为划分地震小区,需计算各网格地面的加速度。如前所述,琦玉县按1.1km×0.9km的方格划分,总共有3819格,若用一维反应分析计算,则其工作量太大。为此,首先绘制按工程地震划分的12种地基类型的入射加速度与加速度反应关系曲线(图2-3-23),其中入射波的波形采用两种,即规模较大的地震时用八户波,而中等地震时用EL Cetco波 八户和EL Cetco是日本地名。
地球物理勘探及地球化学勘探方法在城市建设中的应用
式中,a为地面加速度(10-2m/s2),I为烈度。
‘柒’ 数据分析的六种基本分析方法
数据分析的六种基本分析方法:
1、对比分析法:常用于对纵向的、横向的、最为突出的、计划与实际的等各种相关数据的。例如:今年与去年同期工资收入的增长情况、3月CPI环比增长情况等。
2、趋势分析法:常用于在一段时间周期内,通过分析数据运行的变化趋势(上升或下降),为未来的发展方向提供帮助。例如:用电量的季节性波动、股市的涨跌趋势等。
3、相关分析法:常用于分析两个或多个变量之间的性质以及相关程度。例如:气温与用电量的相关性、运动量大小与体重的相关性等。
4、回归分析法:常用于分析一个或多个自变量的变化对一个特定因变量的影响程度,从而确定其关系。例如:气温、用电设备、用电时长等因素对用电量数值大小的影响程度、工资收入的高低对生活消费支出大小的影响程度等。
5、描述性分析法:常用于对一组数据样本的各种特征进行分析,以便于描述样本的各种及其所代表的总体的特征。例如:本月日平均用电量、上海市工资收入中位数等。
6、结构分析法:常用于分析数据总体的内部特征、性质和变化规律等。例如:各部分用电量占总用电的比重、生活消费支出构成情况等。
‘捌’ 常用的数据分析方法有哪些
①对比分析法通过指标的对比来反映事物数量上的变化,属于统计分析中常用的方法。利用对比分析法可以对数据规模大小、水平高低、速度快慢等做出有效的判断和评价。常见的对比有横向对比和纵向对比。
②分组分析法
分组分析法是指根据数据的性质、特征,按照一定的指标,将数据总体划分为不同的部分,分析其内部结构和相互关系,从而了解事物的发展规律。根据指标的性质,分组分析法分为属性指标分组和数量指标分组。所谓属性指标代表的是事物的性质、特征等,如姓名、性别、文化程度等,这些指标无法进行运算;而数据指标代表的数据能够进行运算,如人的年龄、工资收入等。分组分析法一般都和对比分析法结合使用。
③预测分析法
预测分析法主要基于当前的数据,对未来的数据变化趋势进行判断和预测。预测分析一般分为两种:一种是基于时间序列的预测,例如,依据以往的销售业绩,预测未来3个月的销售额;另一种是回归类预测,即根据指标之间相互影响的因果关系进行预测,例如,根据用户网页浏览行为,预测用户可能购买的商品。
④漏斗分析法
漏斗分析法也叫流程分析法,它的主要目的是专注于某个事件在重要环节上的转化率,在互联网行业的应用较普遍。比如,对于信用卡申请的流程,用户从浏览卡片信息,到填写信用卡资料、提交申请、银行审核与批卡,最后用户激活并使用信用卡,中间有很多重要的环节,每个环节的用户量都是越来越少的,从而形成一个漏斗。使用漏斗分析法,能使业务方关注各个环节的转化率,并加以监控和管理,当某个环节的转换率发生异常时,可以有针对性地优化流程,采取适当的措施来提升业务指标。
⑤AB测试分析法
AB 测试分析法其实是一种对比分析法,但它侧重于对比A、B两组结构相似的样本,并基于样本指标值来分析各自的差异。例如,对于某个App的同一功能,设计了不同的样式风格和页面布局,将两种风格的页面随机分配给使用者,最后根据用户在该页面的浏览转化率来评估不同样式的优劣,了解用户的喜好,从而进一步优化产品。
‘玖’ 数据分析的方法有哪些
数据分析是指通过统计分析方法对收集到的数据进行分析,将数据加以汇总、理解并消化,通过数据分析可以帮助人们作出判断,根据分析结果采取恰当的对策,常用的数据分析方法如下:
将收集到的数据通过加工、整理和分析的过程,使其转化为信息,通常来说,数据分析常用的方法有列表法和作图法,所谓列表法,就是将数据按一定规律用列表方式表达出来,是记录和处理数据最常用的一种方法;
表格设计应清楚表明对应关系,简洁明了,有利于发现要相关量之间的关系,并且在标题栏中还要注明各个量的名称、符号、数量级和单位等;
而作图法则能够醒目地表达各个物理量间的变化关系,从图线上可以简便求出实验需要的某些结果,一些复杂的函数关系也可以通过一定的变化用图形来表现。
想要了解更多关于数据分析的问题,可以咨询一下CDA认证中心。CDA行业标准由国际范围数据领域的行业专家、学者及知名企业共同制定并每年修订更新,确保了标准的公立性、权威性、前沿性。通过CDA认证考试者可获得CDA中英文认证证书。
‘拾’ 数据分析常用的分析方法有哪些
1. 描述型分析
这是最常见的分析方法。在业务中,这种方法向数据分析师提供了重要指标和业务的衡量方法。
例如,每月的营收和损失账单。数据分析师可以通过这些账单,获取大量的客户数据。了解客户的地理信息,就是“描述型分析”方法之一。利用可视化工具,能够有效的增强描述型分析所提供的信息。
2. 诊断型分析
描述性数据分析的下一步就是诊断型数据分析。通过评估描述型数据,诊断分析工具能够让数据分析师深入地分析数据,钻取到数据的核心。
良好设计的BI dashboard能够整合:按照时间序列进行数据读入、特征过滤和钻取数据等功能,以便更好的分析数据。
3. 预测型分析
预测型分析主要用于进行预测。事件未来发生的可能性、预测一个可量化的值,或者是预估事情发生的时间点,这些都可以通过预测模型来完成。
预测模型通常会使用各种可变数据来实现预测。数据成员的多样化与预测结果密切相关。在充满不确定性的环境下,预测能够帮助做出更好的决定。预测模型也是很多领域正在使用的重要方法。
4. 指令型分析
数据价值和复杂度分析的下一步就是指令型分析。指令模型基于对“发生了什么”、“为什么会发生”和“可能发生什么”的分析,来帮助用户决定应该采取什么措施。通常情况下,指令型分析不是单独使用的方法,而是前面的所有方法都完成之后,最后需要完成的分析方法。