㈠ 怎么进行数据分析
进行数据分析:
1、要求明确:准确
明确需求主要是与他人沟通与需求相关的一切内容,并清晰准确地理解和表达相关内容。
在需求沟通中,通过掌握需求的核心内容,可以减少反复沟通。需求的核心内容可以从分析目的、分析主体、分析口径、分析思路、完成时间五个方面来确定。此外,在沟通的过程中,可以适当提出自己的想法,让需求更加清晰立体。
2、确定思路:全面、深入
分析思想是分析的灵魂,是细化分析工作的过程。分析思路清晰有逻辑,能有效避免反复分析问题。从分析目的出发,全面、深入地拆解分析维度,确定分析方法,最终形成完整的分析框架。
3、处理数据:高效
当我们进行数据分析时,我们可能会得到混乱的数据,这就要求我们清洁、整理、快速、准确地加工成适合数据分析的风格。
此时需要使用数据分析软件以工作流的形式提取数据模型的语义,通过易于操作的可视化工具将数据加工成具有语义一致性和完整性的数据模型。系统支持的数据预处理方法包括:采样、拆分、过滤和映射、列选择、空值处理、并行、合并行、元数据编辑、JOIN、行选择、重复值去除等。
4、数据分析:合适的数据
分析数据在分析过程中的地位是首要任务。从分析的目的出发,运用适当的分析方法或模型,使用分析工具分析处理过的数据,提取有价值的信息。
5、显示数据:直观
展示数据又称数据可视化,是以简单直观的方式传达数据中包含的信息,增强数据的可读性,让读者轻松看到数据表达的内容。
6、写报告:建议落地,逻辑清晰
撰写报告是指以文件的形式输出分析结果,其内容是通过全面科学的数据分析来显示操作,可以为决策者提供强有力的决策依据,从而降低操作风险,提高利润。
在撰写报告时,为了使报告更容易阅读和有价值,需要注意在报告中注明分析目标、口径和数据来源;报告应图文并茂,组织清晰,逻辑性强,单一推理;报告应反映有价值的结论和建议。
7、效果反馈:及时
所谓效果反馈,就是选择合适有代表性的指标,及时监控报告中提出的战略执行进度和执行效果。只有输入和输出才能知道自己的操作问题点和闪点,所以效果反馈是非常必要的。反馈时要特别注意两点,一是指标要合适,二是反馈要及时。
㈡ 一份完整的数据分析报告
一份完整的数据分析报告
一份完整的数据分析报告。现代社会属于大数据时代,而数据分析报告是非常重要的,一份完整的数据分析报告并不好写。接下来就由我带大家详细的了解下一份完整的数据分析报告的相关内容。
报告是项目的结果展示,是数据分析结果的有效承载形式。一份思路清晰,言简意赅地数据分析报告能直戳问题痛点,提高沟通效率,获得领导赏识。
对于数据分析报告,首先要有一个概念性的认识,按照报告陈述的思路,可分为四类:
这四类报告由浅入深,分析难度递增,对企业决策的支持程度也递增,尤其是当企业面临某个决策难题时,分析工作要做得足够系统和深刻。
这四类报告我们可以做个比喻。
描述类报告类似记叙文,像个扫描仪一样描绘市场轮廓,不求最深但求最全。
因果类报告类似议论文,像打水井,集中一点,一直探到底。
预测类报告类似科幻小说,像个预言家,根据市场的过去推断市场的未来。
咨询类报告类似推理小说,像小马过河,投石问路,根据分析结论指导企业一路前行。
报告结构
撰写报告前先理清楚三个问题:
写什么内容由决策难题决定,是投资?战略?营销还是其他,相应的报告也就有了相应的内容。
好的报告要求重点突出、主次分明、层次清晰。报告要依附内容的分析以及领导或其他人的阅读习惯,但最重要的是遵循一定的结构化思维。
报告的常见构成
举个例子,比如我用PPT展示一个网民调查的报告
1、标题页: 标题页用于写报告题目,为了方便归档,日夜也应当注明,还有报告撰写者和其单位所在部门。
2、目录页: 目录页将报告的各模块呈现给读者,方便阅读和了解报告结构。
3、分析背景和项目说明: 用于阐述项目需求、分析目的、市场情况、以让读者了解项目的前因后果。项目说明用于注明假设、数据来源等。
4、分析思路页: 这是整个报告的灵魂,便于理解报告的逻辑思路。
5、结论建议页: 结论建议页放在主题前,主要是为了给高层看时,结论建议可大幅度节省时间,简明扼要。
6、分析主体页面: 这里就要搬上你的各种数据表,数据分析图。与表之间,图与图之间的联系如何阐述,反映出的问题如何表达,这些都是在做数据分析图表就要弄明白的。很多细心的领导及专门会针对你的数据分析以及结论来提问,因为现状和未来是他们最关心的。所以你的数据展示一定要体现你的分析思路。
我曾经就被怼过一次,原因是数据分析结果展示于思路脱节,导致领导一直个为什么,那个怎么来,这个数据缺乏依据等等。因为当初的分析报告只是在展示数据,分析不透彻,表之间切换太过生硬,至今记忆犹新。后来,在做数据分析时,我制作一个表,或者一个图,每个表或者图都对不同维度做了深入的数据分析表,领导一问为什么,我就点击进去展示给他看明细,这用的就是FineBI的联动钻取和螺旋式分析功能,在展示时也能实时分析(以往的文章有提过)。
7、附录页:附录页目的是透明分析过程,常防止受访者的基本资料。
报告的论述
一份好的报告,光有好的结构还不够,还要有好的论述,关于论述,有几个注意事项。
1、数据可靠,界定严谨
报告的数据来源一定要可靠。写一份报告,获取和整理数据往往会占据 6成以上的时间。要规划数据协调相关部门组织数据采集、搭建体系平台、导出处理数据,最后才是写报告,为了结论准确有效,你要保证数据的可靠性,否则一切都可能会变成误导决策的努力。
界定是指报告中要对数据的来源、计算、概念做说明。不同的界定,有不同的结论。比如什么是高端微波炉,不同的界定,得到的数据肯定是不同的。
2、概念一致,标准统一
一些名词的解释和定义,前后要一致,不要让人不知所云。
3、直观呈报,通俗易懂
我们写得报告还是金亮图标话,用生动的图表代替数字和文字的大量对切往往更形象直观地理解你的.分析和结论。
1、你要一个故事
我自己有个想法,就是产品经理应该多学习相关领域的知识,比如学一些基础的设计规范、交互原则、营销知识,心理学知识,算法知识等等。除了一些明显的对工作的帮助,也能帮助自己扩展思路。其实做好报告,就应向咨询机构或者投资机构学习。
一个报告核心不是包含很多内容,让听众或者读者去花时间理解,核心是讲好一个简单的故事。咨询和投资机构做BP之前,会先花时间理清楚storyline。其实各种报告都应该这样,先理清楚你要讲的故事。
2、一个数据分析报告的框架
这里列出一个我个人比较喜欢的报告框架,可能针对不同的报告场景需要有所调整(比如删除部分步骤,或者增加部分细节):
项目背景:简述项目相关背景,为什么做,目的是什么
项目进度:综述项目的整体进程,以及目前的情况
名词解释:关键性指标定义是什么,为什么这么定义
数据获取方法:如何取样,怎么获取到的数据,会有哪些问题
数据概览:重要指标的趋势,变化情况,重要拐点成因解释
数据拆分:根据需要拆分不同的维度,作为细节补充
结论汇总:汇总之前数据分析的主要结论,作为概览
后续改进:分析目前存在的问题,并给出解决改进防范
致谢
附件:详细数据
项目背景 & 项目进度
项目背景,需要简述项目相关背景,为什么做,目的是什么。项目进度,需要综述项目的整体进程,以及目前的情况。这两点其实没什么可说的,如果对象是项目成员,可以写简单一些,如果对象是对项目不了解的人,则需要多写 一些,但还是要尽量用最简单的话,跟别人讲明白。
名词解释 & 数据获取方法
名词解释:关键性指标定义是什么,为什么这么定义。这点是很多人忽略的,其实很多时候数据的误解都是因为对指标没有统一的定义。举例而言,点击率可以是点击次数/浏览次数,也可以是点击人数/浏览人数。人数可能按访问去重,也可能按天去重。如果没有清晰的解释,不同人理解不同,对整个数据的可读性就大打折扣。
数据获取方法:如何取样,怎么获取到的数据,会有哪些问题。原始数据往往有一些缺憾,要经过数据清洗剔除噪声,也需要部分假设进行数据补全。数据清洗和数据补全的方法需要跟汇报对象说明并且获得认可,让对方对于置信度有一个估计。
数据概览 & 数据拆分
数据概览,需要有重要指标的趋势,变化情况,重要拐点成因解释。
数据拆分,需要根据需要拆分不同的维度,作为细节补充。
这里基本上就是之前说的数据分析方法了。如果需要对方知道对比或者趋势,则使用图,如果需要对方知道具体数据,则使用表。表格对需要强调的数字要做明显标识。需要注意的点是:核心指标要少而关键,拆分指标要有意义且详细。同时如果是PPT的话,每页说明白一个结论或者解释清楚一个趋势足以。关键性结论要用一句话能说清楚。
结论汇总 & 后续改进
结论汇总,基本是对之前数据分析阶段的数据进行汇总,形成完整的结论。
后续改进,需要在数据分析的结论和问题的基础上,对后续的迭代和改进措施作出方向性的说明。这部分其实很多时候也是分析的根本目的。
致谢 & 附件
致谢是对项目组合相关协助部门的致谢,基本上对于项目组和相关协助部门而言,也希望自己的工作或者积极配合能看到有效的数据结果。在之后的合作中,也会更加融洽。
附件是需要附赠更多没有必要在数据报告中体现但是仍然有价值的数据。对于PPT而言,这部分也可以放在PPT致谢之后,与会同事有疑问,可以随时翻到最后解释。
3、总结
一个产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。这是说数据。
而数据报告的意义也是类似,项目完成之后需要完整汇报,这样无论是对上汇报还是对团队而言,都是有重要意义。
突然想到一个事情。去年的时候做了一个内部数据平台,到了取名字的时候,我用了dice。为什么叫dice呢?
这得从物理说起(开启神棍模式)。物理学不断前行,之前人们认为物理学是决定论的,只要知道系统的初始值和足够细节,就能知道之后系统的演化路径。后来发现不是这样的,对于一个基本粒子而言,观测之前,粒子状态和位置是不可预测的。爱因斯坦说“上帝不会掷骰子”,然后后续的研究,更多的是支持上帝是掷骰子的。这也是dice的来源。
即使是上帝视角,也不可能知道提前知道数据的结果。那么作为产品经理而言,尊重数据结果,并分析形成结论,远比相信一些所谓的方法论的条条框框好得多。
企业需要发展就需要得到更多信息,这些信息需要有专业能力的人才提供给企业,而这就是数据分析师,数据分析师要通过专业的手段获取信息,对信息做整合,分析信息,最终形成数据分析统计报告。
在数据分析师的全部工作流程中,数据分析统计报告作为工作的成果是对企业、以及项目的最终发展方向及目标的决策起到至关重要的依据。
在编写一份完整的数据分析报告前,这些数据报告给谁看,首先你要知道你的这份报告要突出那些点,在做一个数据分析之前领导所关心的哪些点,围绕着这些中心点,简单明了的进行编写数据报告。
数据报告不需要大批量的文字阐述,本身数据分析是围绕数据为核开展相应的工作,数据报告要突出的也是最终的统计结果,以数字的方式进行简单明了的阐述对比,报告中加入一些画像模型,柱线图、饼状图来表示占有份额等等最为突出,让阅览者可以很好的理解,很容易在你的这份报告中找到自己企业在市场的份额,这是作为一个优秀的数据分析师的基本功。
先展示自己在行业内的情况后还要分析当前整个市场的数据变化走势,通过对自身行业市场的大数据统计,找到市场发展新的切入点、客户们所关心的新问题、潜在客户的特征最终形成走势图为企业提供发展方向。
哪些点是我们不足的地方,哪些是我们需要开展的新业务等等,这些都会从行业数据大趋势发展中体现出来,从而为企业未来的发展决策提供参考依据,为企业领导提供新的信息点,帮助企业思考、创新、完善做出一份满意的答卷。
㈢ 调研报告大数据分析怎么做
1、明确思路
明确数据分析的目的以及思路是确保数据分析过程有效进行的首要条件。它作用的是可以为数据的收集、处理及分析提供清晰的指引方向。可以说思路是整个分析流程的起点。首先目的不明确则会导致方向性的错误。当明确目的后,就要建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
2、收集数据
收集数据是按照确定的数据分析框架收集相关数据的过程,它为数据分析提供了素材和依据。这里所说的数据包括第一手数据与第二手数据,第一手数据主要指可直接获取的数据,第二手数据主要指经过加工整理后得到的数据。
3、处理数据
处理数据是指对收集到的数据进行加工整理,形成适合数据分析的样式,它是数据分析前必不可少的阶段。数据处理的基本目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。
4、分析数据
分析数据是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。由于数据分析多是通过软件来完成的,这就要求数据分析师不仅要掌握各种数据分析方法,还要熟悉数据分析软件的操作。而数据挖掘其实是一种高级的数据分析方法,就是从大量的数据中挖掘出有用的信息,它是根据用户的特定要求,从浩如烟海的数据中找出所需的信息,以满足用户的特定需求。
5、展现数据
一般情况下,数据是通过表格和图形的方式来呈现的,我们常说用图表说话就是这个意思。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等,当然可以对这些图表进一步整理加工,使之变为我们所需要的图形。
6、撰写报告
数据分析报告其实是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。另外,数据分析报告需要有明确的结论,没有明确结论的分析称不上分析,同时也失去了报告的意义,因为我们最初就是为寻找或者求证一个结论才进行分析的,所以千万不要舍本求末。最后,好的分析报告一定要有建议或解决方案。
㈣ 如何建立数据分析的思维框架
曾经有人问过我,什么是数据分析思维?如果分析思维是一种结构化的体现,那么数据分析思维在它的基础上再加一个准则:
不是我觉得,而是数据证明
这是一道分水岭,“我觉得”是一种直觉化经验化的思维,工作不可能处处依赖自己的直觉,公司发展更不可能依赖于此。数据证明则是数据分析的最直接体现,它依托于数据导向型的思维,而不是技巧,前者是指导,后者只是应用。
作为个人,应该如何建立数据分析思维呢?
丨建立你的指标体系
在我们谈论指标之前,先将时间倒推几十年,现代管理学之父彼得·德鲁克说过一句很经典的话:
如果你不能衡量它,那么你就不能有效增长它。
所谓衡量,就是需要统一标准来定义和评价业务。这个标准就是指标。假设隔壁老王开了一家水果铺子,你问他每天生意怎么样,他可以回答卖的不错,很好,最近不景气。这些都是很虚的词,因为他认为卖的不错也许是卖了 50 个,而你认为的卖的不错,是卖了 100 。
这就是“我觉得”造成的认知陷阱。将案例放到公司时,会遇到更多的问题:若有一位运营和你说,产品表现不错,因为每天都有很多人评价和称赞,还给你看了几个截图。而另外一位运营说,产品有些问题,推的活动商品卖的不好,你应该相信谁呢?
其实谁都很难相信,这些众口异词的判断都是因为缺乏数据分析思维造成的。
老王想要描述生意,他应该使用销量,这就是他的指标,互联网想要描述产品,也应该使用活跃率、使用率、转化率等指标。
如果你不能用指标描述业务,那么你就不能有效增长它。
了解和使用指标是数据分析思维的第一步,接下来你需要建立指标体系,孤立的指标发挥不出数据的价值。和分析思维一样,指标也能结构化,也应该用结构化。
我们看一下互联网的产品,一个用户从开始使用到离开,都会经历这些环节步骤。电商APP还是内容平台,都是雷同的。想一想,你会需要用到哪些指标?
而下面这张图,解释了什么是指标化,这就是有无数据分析思维的差异,也是典型的数据化运营,有空可以再深入讲这块。
指标体系没有放之四海而皆准的模板,不同业务形态有不同的指标体系。移动 APP 和网站不一样, SaaS 和电子商务不一样,低频消费和高频消费不一样。好比一款婚庆相关的 APP ,不需要考虑复购率指标;互联网金融,必须要风控指标;电子商务,卖家和买家的指标各不一样。
这些需要不同行业经验和业务知识去学习掌握,那有没有通用的技巧和注意事项呢?
丨好指标与坏指标
不是所有的指标都是好的。这是初出茅庐者常犯的错误。我们继续回到老王的水果铺子,来思考一下,销量这个指标究竟是不是好的?
丨最近物价上涨,老王顺应调高了水果价格,又不敢涨的提高,虽然水果销量没有大变化,但老王发现一个月下来没赚多少,私房钱都不够存。
丨老王这个月的各类水果销量有 2000 ,但最后还是亏本了,仔细研究后发现,虽然销量高,但是水果库存也高,每个月都有几百单位的水果滞销最后过期亏本。
这两个例子都能说明只看销量是一件多不靠谱的事情。销量是一个衡量指标,但不是好指标。老王这种个体经营户,应该以水果铺子的利润为核心要素。
好指标应该是核心驱动指标。虽然指标很重要,但是有些指标需要更重要。就像销量和利润,用户数和活跃用户数,后者都比前者重要。
核心指标不只是写在周报的数字,而是整个运营团队、产品团队乃至研发团队都统一努力的目标。
核心驱动指标和公司发展关联,是公司在一个阶段内的重点方向。记住是一个阶段,不同时期的核心驱动指标不一样。不同业务的核心驱动指标也不一样。
互联网公司常见的核心指标是用户数和活跃率,用户数代表市场的体量和占有,活跃率代表产品的健康度,但这是发展阶段的核心指标。在产品 1.0 期间,我们应把注意力放到打磨产品上,在大推广前提高产品质量,这时留存率是一个核心指标。而在有一定用户基数的产品后期,商业化比活跃重要,我们会关注钱相关的指标,比如广告点击率、利润率等。
核心驱动指标一般是公司整体的目标,若从个人的岗位职责看,也可以找到自己的核心指标。比如内容运营可以关注阅读数和阅读时长。
核心驱动指标一定能给公司和个人带来最大优势和利益,记得二八法则么?20%的指标一定能带来 80% 的效果,这 20% 的指标就是核心。
另外一方面,好的指标还有一个特性,它应该是比率或者比例。
拿活跃用户数说明就懂了,我们活跃用户有 10 万,这能说明什么呢?这说明不了什么。如果产品本身有千万级别的注册用户,那么 10 万用户说明非常不健康,产品在衰退期。如果产品只拥有四五十万用户,那么说明产品的粘性很高。
正因为单纯的活跃用户数没有多大意义,所以运营和产品会更关注活跃率。这个指标就是一个比率,将活跃用户数除以总用户数所得。所以在设立指标时,我们都尽量想它能不能是比率。
坏指标有哪些呢?
其一是虚荣指标,它没有任何的实际意义。
产品在应用商店有几十万的曝光量,有意义吗?没有,我需要的是实际下载。下载了意义大吗?也不大,我希望用户注册成功。曝光量和下载量都是虚荣指标,只是虚荣程度不一样。
新媒体都追求微信公众号阅读数,如果靠阅读数做广告,那么阅读数有意义,如果靠图文卖商品,那么更应该关注转化率和商品销量,毕竟一个夸张的标题就能带来很高的阅读量,此时的阅读量是虚荣指标。可惜很多老板还是孜孜不倦的追求 10W+ ,哪怕刷量。
虚荣指标是没有意义的指标,往往它会很好看,能够粉饰运营和产品的工作绩效,但我们要避免使用。
第二个坏指标是后验性指标,它往往只能反应已经发生的事情。
比如我有一个流失用户的定义:三个月没有打开APP就算做流失。那么运营每天统计的流失用户数,都是很久没有打开过的,以时效性看,已经发生很久了,也很难通过措施挽回。我知道曾经因为某个不好的运营手段伤害了用户,可是还有用吗?
活动运营的 ROI(投资回报率)也是后验性指标,一个活动付出成本后才能知道其收益。可是成本已经支出,活动的好与坏也注定了。活动周期长,还能有调整余地。活动短期的话,这指标只能用作复盘,但不能驱动业务。
第三个坏指标是复杂性指标,它将数据分析陷于一堆指标造成的陷阱中。
指标能细分和拆解,比如活跃率可以细分成日活跃率、周活跃率、月活跃率、老用户活跃率等。数据分析应该根据具体的情况选择指标,如果是天气类工具,可以选择日活跃率,如果是社交 APP ,可以选择周活跃率,更低频的产品则是月活跃率。
每个产品都有适合它的几个指标,不要一股脑的装一堆指标上去,当你准备了二三十个指标用于分析,会发现无从下手。
丨指标结构
既然指标太多太复杂不好,那么应该如何正确的选择指标呢?
和分析思维的金字塔结构一样,指标也有固有结构,呈现树状。指标结构的构建核心是以业务流程为思路,以结构为导向。
假设你是内容运营,需要对现有的业务做一个分析,提高内容相关数据,你会怎么做呢?
我们把金字塔思维转换一下,就成了数据分析方法了。
从内容运营的流程开始,它是:内容收集—内容编辑发布—用户浏览—用户点击—用户阅读—用户评论或转发—继续下一篇浏览。
这是一个标准的流程,每个流程都有指标可以建立。内容收集可以建立热点指数,看哪一篇内容比较火。用户浏览用户点击则是标准的 PV 和 UV 统计,用户阅读是阅读时长。
从流程的角度搭建指标框架,可以全面的囊括用户相关数据,无有遗漏。
这套框架列举的指标,依旧要遵循指标原则:需要有核心驱动指标。移除虚荣指标,适当的进行删减,不要为添加指标而添加指标。
丨维度分析法
当你有了指标,可以着手进行分析,数据分析大体可以分三类,第一类是利用维度分析数据,第二类是使用统计学知识如数据分布假设检验,最后一类是使用机器学习。我们先了解一下维度分析法。
维度是描述对象的参数,在具体分析中,我们可以把它认为是分析事物的角度。销量是一种角度、活跃率是一种角度,时间也是一种角度,所以它们都能算维度。
当我们有了维度后,就能够通过不同的维度组合,形成数据模型。数据模型不是一个高深的概念,它就是一个数据立方体。
上图就是三个维度组成的数据模型/数据立方体。分别是产品类型、时间、地区。我们既能获得电子产品在上海地区的 2010 二季度的销量,也能知道书籍在江苏地区的 2010 一季度销量。
数据模型将复杂的数据以结构化的形式有序的组织起来。我们之前谈到的指标,都可以作为维度使用。下面是范例:
丨将用户类型、活跃度、时间三个维度组合,观察不同用户群体在产品上的使用情况,是否A群体使用的时长更明显?
丨将商品类型、订单金额、地区三个维度组合,观察不同地区的不同商品是否存在销量差异?
数据模型可以从不同的角度和层面来观察数据,这样提高了分析的灵活性,满足不同的分析需求、这个过程叫做 OLAP(联机分析处理)。当然它涉及到更复杂的数据建模和数据仓库等,我们不用详细知道。
数据模型还有几种常见的技巧、叫做钻取、上卷、切片。
选取就是将维度继续细分。比如浙江省细分成杭州市、温州市、宁波市等, 2010 年一季度变成 1 月、 2 月、 3 月。上卷则是钻取的相反概念,将维度聚合,比如浙江、上海、江苏聚合成浙江沪维度。切片是选中特定的维度,比如只选上海维度、或者只选 2010 年一季度维度。因为数据立方体是多维的,但我们观察和比较数据只能在二维、即表格中进行。
上图的树状结构代表钻取(source 和 time 的细分),然后通过对 Route 的 air 切片获得具体数据。
聪明的你可能已经想到,我们常用的数据透视表就是一种维度分析,将需要分析的维度放到行列组合进行求和、计数、平均值等计算。放一张曾经用到的案例图片:用城市维度和工作年限维度,计算平均工资。
除了 Excel 、BI 、R 、Python 都能用维度分析法。BI 是相对最简便的。
谈到维度法,想要强调的是分析的核心思维之一:对比,不同维度的对比,这大概是对新人快速提高的最佳捷径之一。比如过去和现在的时间趋势对比,比如不同地区维度的对比,比如产品类型的区别对比,比如不同用户的群体对比。单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。
我想要分析公司的利润,利润 = 销售额 - 成本。那么找出销售额涉及的指标/维度,比如产品类型、地区、用户群体等,通过不断的组合和拆解,找出有问题或者表现良好的原因。成本也是同理。
这就是正确的数据分析思维。总结一下吧:我们通过业务建立和筛选出指标,将指标作为维度,利用维度进行分析。
很多人会问,指标和维度有什么区别?
维度是说明和观察事物的角度,指标是衡量数据的标准。维度是一个更大的范围,不只是数据,比如时间维度和城市维度,我们就无法用指标表示,而指标(留存率、跳出率、浏览时间等)却可以成为维度。通俗理解:维度>指标。
到这里,大家已经有一个数据分析的思维框架了。之所以是框架,因为还缺少具体的技巧,比如如何验证某一个维度是影响数据的关键,比如如何用机器学习提高业务,这些涉及到数据和统计学知识,以后再讲解。
这里我想强调,数据分析并不是一个结果,只是过程。还记得“如果你不能衡量它,那么你就不能有效增长它”这句话吗?数据分析的最终目的就是增长业务。如果数据分析需要绩效指标,一定不会是分析的对错,而是最终数据提升的结果。
数据分析是需要反馈的,当我分析出某项要素左右业务结果,那么就去验证它。告诉运营和产品人员,看看改进后的数据怎么样,一切以结果为准。如果结果并没有改善,那么就应该反思分析过程了。
这也是数据分析的要素,结果作导向。分析若只是当一份报告呈现上去,后续没有任何跟进、改进的措施,那么数据分析等与零。
业务指导数据,数据驱动业务。这才是不二法门。
作者:秦路
㈤ 如何从一开始就设计好数据分析的基本框架
如何从一开始就设计好数据分析的基本框架
下面这篇文章中向我们讲解创业者们如何可以从一开始就设计好数据分析的基本框架:将数据储存于何处?用什么工具分析最好?可以规避哪些常见的错误?以及,今天的你如何亡羊补牢?
关于数据分析,避免6个错误
1.走得太快,没空回头看路
初创公司里的人们仿佛一直在被人念着紧箍咒:“要么快要么死,要么快要么死。”他们是如此着急于产品开发,以至于他们常常没有空想用户对产品的具体使用细节,产品在哪些场景怎么被使用,产品的哪些部分被使用,以及用户回头二次使用产品的原因主要有哪些。而这些问题如果没有数据难以回答。
2.你没有记录足够的数据
光给你的团队看呈现总结出来的数据是没有用的。如果没有精确到日乃至小时的变化明细,你无法分析出来数据变化背后看不见的手。如果只是粗放的,断续的统计,没有人可以解读出各种细微因素对于销售或者用户使用习惯的影响。
与此同时,数据储存越来越便宜。同时做大量的分析也不是什么高风险的事情,只要买足够的空间就不会有system breakdown的风险。因此,记录尽可能多的数据总不会是一件坏事。
不要害怕量大。对于初创企业来说,大数据其实还是比较少见的事情。如果正处于初创期的你果真(幸运地)有这样的困扰,Porterfield(本文)推荐使用一个叫Hadoop的平台。
3.其实你的团队成员常常感觉自己在盲人摸象
许多公司以为他们把数据扔给Mixpanel, Kissmetrics,或者Google Analytics就够了,但他们常常忽略了团队的哪些成员能真正解读这些数据的内在含义。你需要经常提醒团队里面每一位成员多去理解这些数据,并更多地基于数据来做决策。要不然,你的产品团队只会盲目地开发产品,并祈祷能踩中热点,不管最终成功还是失败了都是一头雾水。
举例:
有天你决定采用市场上常见的病毒营销手段吸引新用户。如你所愿,用户量啪啪啪地上来了。可此时你会遇到新的迷茫:你无法衡量这个营销手段对老用户的影响。人们可能被吸引眼球,注册为新用户,然后厌倦而不再使用。你可能为吸引了一帮没有价值的用户付出了过高的代价。而你的产品团队可能还在沾沾自喜,认为这个损害产品的营销手段是成功的。
这种傻错误经常发生。而如果你的企业在一开始就建立起人人可自助使用的数据平台,来解答他们工作中最重要的疑惑,则可以避免上文所说的悲剧。
4.把数据存放在不合适的地方
先让我们来看一个正确示范吧。Porerfield提到他有个客户整合了NoSQL, Redshift,Kitnesis以及Looker的资源自创了一个数据分析框架。这个框架不仅能在很高的量级上捕获及储存自己的数据,还能承受每月数以百万计的点击流量,还能让所有人查询自己想要的数据。这个系统甚至可以让不懂SQL语言的小白用户们真正理解数据的意义。而在数据分析的世界里,基本上如果你不会SQL,你就完蛋了。如果总是要等待工程师去把数据跑出来,那就是把自己陷入困境。而工程师在不理解需求的情况下建立的算法或者买的软件对于使用者来说往往是个煎熬,因为他们对数据的使用往往与前者不再同一水平线上。
你需要让你所有的数据都存放在同一个地方。这个是关键关键最关键的原则。
让我们回到前文那个假设存在的公司。他们做了一个又一个病毒营销,但是没有把用户活动数据放在同一框架内,所以他们无法分析一个活动是如何关联到另一个活动的。他们也无法进行一个横跨日常运营以及活动期间的数据分析比较。
很多公司把数据发给外包商储存,然后就当甩手掌柜了。可是常常这些数据到了外包商手里就会变成其他形式,而转化回来则需要不少工序。这些数据往往是某些宣传造势活动时期你的网站或者产品的相关数据。结合日常运营数据来看,你可以挖掘哪些活动促成了用户转化。而这样结合日常运营数据来分析用户使用历程的方式是至关重要的。但令人震惊的是,尽管任何时期的所有运营数据都至关重要,许多公司仍不屑于捕获及记录他们。约一半以上Porterfield所见过的公司都将日常运营数据与活动数据分开来看。这样严重妨碍了公司正确地理解与决策。
5.目光短浅
任何一个好的数据分析框架在设计之初都必须满足长期使用的需要。诚然,你总是可以调整你的框架。但数据积累越多,做调整的代价越大。而且常常做出调整后,你需要同时记录新旧两套系统来确保数据不会丢失。
因此,我们最好能在第一天就把框架设计好。其中一个简单粗暴有效地方法就是所有能获取的数据放在同一个可延展的平台。不需要浪费时间选择一个最优解决方法,只要确认这个平台可以装得下所有将来可能用到的数据,且跨平台也能跑起来就行了。一般来说这样的原始平台能至少支撑一到两年。
6.过度总结
虽然说这个问题对于拥有大数据分析团队的公司来说更常见,初创公司最好也能注意避免掉。试想一下,有多少公司只是记录平均每分钟多少销售额,而不是具体每一分钟销售了多少金额?在过去由于运算能力有限,我们只能把海量数据总结成几个点来看。但在当下,这些运算量根本不是问题,所有人都可以把运营数据精确到分钟来记录。而这些精确的记录可以告诉你海量的信息,比如为什么转化率在上升或者下降。
人们常常自我陶醉于做出了几张漂亮的图标或者PPT。这些总结性的表达看上去很令人振奋,但我们不应该基于这些肤浅的总结来做决策,因为这些漂亮的总结性陈述并不能真正反映问题的实质。相反,我们更应该关注极端值(Outliers)。
3个简单防护措施,帮你少走弯路
少犯错误远比你想的重要,因为错误一旦发生,很容易耗费大量的工程时间和资源来弥补错误。如果不小心,你的工程师们可能花费昂贵的时间来为销售团队解码数据,可能错过无数宝贵的营销机会。每当数据变得难使用或者理解时,你的团队决策速度会变慢,因此你的生意进展必将受到拖累
好消息是,如果你从有用户伊始就采用以下3个简单的防护措施,你一定可以避免走很多弯路。
1.任命一个商业数据首席工程师
如果你能在团队中找到一个队数据分析真正有兴趣的工程师,你可以让他负责记录管理所有数据。这将为整个团队节省海量的时间。Porterfield分享到,在Looker,这样的一个商业数据首席工程师负责写能记录所有数据的脚本,从而方便大家总是能在同一个数据库内获取需要的信息。事实证明,这是个简单有效的方法,极大地提高了团队的工作效率。
2.把数据放在开放的平台上
Porterfield强力推荐大家使用类似于Snowplow的开源平台,以能实时记录所有与产品相关的活动事件数据。它使用方便,有好的技术支援,可以放量使用。而最棒的一点,它能与你其余的数据框架很好的兼容。
3.尽快将你的数据迁移到AWS Redshift或者其它大规模并行处理数据库(MPP)上
对于还处于早期的公司来说,类似于Redshift这种基于云端的MPP经常就是最好的选择。因为他们价格便宜,便于部署和管理,并且扩展性强。在理想状况下,你会希望从公司有记录之初就将你的事件与操作的数据写入亚马逊Redshift之中。“使用Redshift的好处在于这个平台便宜,迅速,可访问性高,”Porterfield说。并且,对于那些已经使用AWS服务的人来说,它(使用redshift)可以无缝接入你已有的架构中。你可以很容易的建设一个数据通道把数据直接传入这个系统中进行分析处理。“Redshift能让你灵活的写入巨量的颗粒状的数据而并不根据事件触发量的多少这样难以估计的参数来收费,”他说。“其它的服务会根据你储存事件的多少来收费,所以当越来越多的人使用你的产品时,越来越多的操作数据会被记录下来,这会导致最终的收费像火箭一样越升越高。”
如何用数据分析占领市场先机?
数据分析的价值取决于它能如何帮助你占领市场先机。作为初创公司,所有的数据应该被用于你对公司不同阶段设立的目标上。
举例
一个快递公司通常会检测平均送达每件货物的时间。这看上去是很关键的数据,但如果没有充分的上下文(毕竟收货人可能在一个街区外,也可能在几百公里外),这也是没有意义的。另一个角度上,平均送货时间也没有收货人的整体满意度重要。因此,你必须确保你的分析囊括了正确的数据。
以上是小编为大家分享的关于如何从一开始就设计好数据分析的基本框架的相关内容,更多信息可以关注环球青藤分享更多干货
㈥ 市场数据分析怎么做
1.明确目的和思路
首先明白本次的目的,梳理分析思路,并搭建整体分析框架,把分析目的分解,化为若干的点,清晰明了,即分析的目的,用户什么样的,如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标(各类分析指标需合理搭配使用)。同时,确保分析框架的体系化和逻辑性。
2.数据收集
根据目的和需求,对数据分析的整体流程梳理,找到自己的数据源,进行数据分析,一般数据来源于四种方式:数据库、第三方数据统计工具、专业的调研机构的统计年鉴或报告(如艾瑞资讯)、市场调查。
3.数据处理
数据收集就会有各种各样的数据,有些是有效的有些是无用的,这时候我们就要根据目的,对数据进行处理,处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法,将各种原始数据加工成为产品经理需要的直观的可看数据。
4.数据分析
数据处理好之后,就要进行数据分析,数据分析是用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
5.数据展现
一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
6.报告撰写
撰写报告一定要图文结合,清晰明了,框架一定要清楚,能够让阅读者读懂才行。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
㈦ 大数据分析方法,常用的哪些
数据分析的目的越明确,分析越有价值。明确目的后,需要梳理思路,搭建分析框架,把分析目的分解成若干个不同的分析要点,然后针对每个分析要点确定分析方法和具体分析指标;最后,确保分析框架的体系化(体系化,即先分析什么,后分析什么,使得各个分析点之间具有逻辑联系),使分析结果具有说服力。
㈧ 现在有一批数据要进行分析,可以从哪些方面进行
可以从如下三个方面:现状分析、原因分析、预测分析。
1.明确分析目的与思路:一切以解决业务问题为中心,依据分析目标明确思路,打开分析视角,使数据分析框架体系化。
2.数据收集与预处理:数据来源有Excel/CSV/SQL数据库/NoSQL数据库/Hive数据仓库/外部数据,从数据来源收集数据后需要做清洗工作,包括缺失值、错误值、重复值、异常值等都要处理好,当然还有转换、拆分、合并等等工作也可能要做,这样才能满足后续数据分析的要求。
3.数据分析与挖掘:使用各种数据分析方法与分析工具(如Excel/SQL/SPSS/SAS/Tableau/PowerBI/Python)进行分析挖掘。
4.数据可视化并生成报告:使用专业化图表,也可以结合表格,最后以报告方式输出数据分析成果。
㈨ 自学转行数据分析类岗位需要掌握哪些知识框架
数据分析类岗位有两个大的职业方向选择:业务方向和技术方向。
业务方向的数据分析岗位可以从初级数据分析师入手,逐渐成长为业务负责人;而如果你更偏好技术性工作,那么数据相关岗位中可以选择数据挖掘工程师、大数据开发工程师、数据建模师。无论选择哪一种岗位,数据分析能力都是对求职者最基础的要求。正确规划数据分析学习路径从而自学,也要从数据分析能力入手,学习的内容包括但不限于数据分析思维、统计学知识、数据分析技术、数据建模能力以及可视化能力。
一、数据库语言SQL
SQL语言作为一门编程语言,是数据分析师的必备能力,也是数据分析师必须要熟练掌握的基本功,可以作为数据分析的入门学习内容之一。对于SQL语言的编程基本特性,初学者们首先需要掌握基础的查询语句,从而进行复杂查询的学习。学习期间,不要忘了穿插各类函数的使用,如聚合函数、数值函数等。基于不同数据库,SQL语法可能会略有差异,但不会影响我们对基本功的掌握。
二、统计学基础
统计学是数据分析的理论基础,描述性统计以及各类统计图表的使用也早已深入到数据分析师的工作日常。在数据分析师的工作场景中,日常的基础原理便是统计学中的假设检验分析方法。此外,在后期的学习过程中,良好的统计学基础也可以为机器学习内容做铺垫。
三、机器学习
机器学习更多作为数据建模师和数据科学家的必要能力,在日常工作中常和语言混合应用,对数据及属性进行预测和分类。对于初级数据分析师来说,机器学习知识并不是工作场景中的必要内容,但对于高级数据。分析师来说,掌握机器学习却是必经之路。此外,在现阶段数据分析的笔面试过程中,机器学习基础知识往往作为必要考点出现。因此在机器学习阶段,求职者们可以借用学习一些基础的算法。
㈩ 电商数据分析应该从哪些方面进行分析
从8个方面来阐述如何对电商平台进行数据分析:
1.总体运营指标:从流量、订单、总体销售业绩、整体指标进行把控,起码对运营的电商平台有个大致了解,到底运营的怎么样,是亏是赚。
2.网站流量指标:即对访问你网站的访客进行分析,基于这些数据可以对网页进行改进,以及对访客的行为进行分析等等。
3.销售转化指标:分析从下单到支付整个过程的数据,帮助你提升商品转化率。也可以对一些频繁异常的数据展开分析。
4.客户价值指标:这里主要就是分析客户的价值,可以建立RFM价值模型,找出那些有价值的客户,精准营销等等。
5.商品类指标:主要分析商品的种类,那些商品卖得好,库存情况,以及可以建立关联模型,分析那些商品同时销售的几率比较高,而进行捆绑销售。
6.市场营销活动指标,主要监控某次活动给电商网站带来的效果,以及监控广告的投放指标。
7.风控类指标:分析卖家评论,以及投诉情况,发现问题,改正问题。
8.市场竞争指标:主要分析市场份额以及网站排名,进一步进行调整
想要更精准的了解电商平台的数据分析,推荐咨询情报通。情报通全面覆盖国内外主流电商平台全类目电商数据,可进行多重属性交叉分析,通过对不同属性组合进行分析,指导生产、指导订货,指导制定广告投放策略,应用严谨的方法,进行数据爬取、数据计算、数据整理,常规数据日级抓取,直播数据分钟级抓取,每周进行数据更新,可以随时登录系统进行查看。