㈠ 如何利用python进行高通量测序数据的分析 知乎
建议读两本书:
1、集体智慧编程 (豆瓣)
因为Python是一门不需要花太多精力(甚至可以说很少),就可以基本掌握的一门语言,所以推荐这本书。题主提到以后想学机器学习,这是一本非常好的入门书,书中的例子源码都是Python实现的,并且能帮你迅速熟悉Python相关的各种计算库。
2、统计学习方法 (豆瓣)
考虑到题主要学得踏实,这本书深入浅出地讲了和机器学习有关的一切数学基础知识,一整本的干货,没有废话,非常值得一读。题主数学专业的话,读起来应该会比我更顺畅。
㈡ essec商业数据分析科学专业怎么样知乎
作者:知乎用户
链接:https://www.hu.com/question/36214681/answer/66483598
来源:知乎
着作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
从商业分析说起吧。关注过不少知乎上类似的问题和回答,发现个较严重的问题:大多数人对商业分析这个行业的认知并不准确。具体说来商业分析有两种:
1. Business analysis. 应属于传统商科,主要是任务是对公司整个运营的流程、业务的开展等方面的分析。比如发现新的商业需求、提出/改善某些商业问题的解决方案。它可能包括公司组织上的变更,业务流程的改善,策略性的规划,政策的制定和提高。这个领域需要一定的数据分析,一方面因为公司发展前期一般主要靠业务的扩展,会涉及一些销售业绩等类似的数据分析。另一方面,大数据时代嘛,很多公司都觉得好像应该顺应潮流掺和一把。但总的来说还是business analysis为主。即定性为主导,数据分析(一般较简单)为辅助。这也是大多数答主所提到的。要在这个领域成长为专业人才,一般会选择MBA,MBA课程一般也会包含一定的相关课程,但很简单。
2. Business analytics. 这才是真正的新兴学科。翻译上都叫商业分析,但内容却差很多,所以特意用英文区分开来。这个行业的核心就是数据分析,而且是高深的技术、模型和算法。通过对数据的深度分析、挖掘来研究公司以往的业绩,对行业市场潜在的商业信息的搜索等。目的是获取那些通过定性分析和简单的定量分析根本无法获得的insights。这个领域逐渐得到了学术界、业界和政府的高度重视:学术界,从纽约大学13年开始开设business analytics的硕士专业以来,全球各大高校纷纷增设相关专业,并且学费直逼MBA,在金钱至上的资本主义国家,高学费往往是高收入和良好职业发展的风向标。业界,更不用说了,BAT都在开设这一类的部门,阿里巴巴去年跟今年就从名校挖了一些这个领域的教授,网络更是把斯坦福大牛Andrew Ng请了来。政府,就我知道的,新加坡和澳洲政府直接拨款赞助开设business analytics部门的公司。
说完基本概念,回到题主问题。仔细读过问题描述后,我相信题主感兴趣的应该是business analytics吧(不是的话,就请忽略以下吧)。那再深入一点讲一下相关的技能。题主是统计本科生,很好!哈哈!我是统计博士,现在在纽约一家投资管理公司做类似的工作,同事不乏一些计算机、自动控制、信号处理等数据分析相关的领域的博士。总体来说business analytics无疑是个交叉学科,包括数学(统计)、计算机和商学(经济学、市场营销,博弈论等等)。统计类的方法占据了数据分析学科的首要地位(主要是回归模型)。可以说如果把统计方法全部拿走,数据科学基本就支离破碎不成体系了。然后是计算机(包括机器学习、模式识别、图像处理等一类的领域),基于一些应用层面的需求,计算机领域提出了一些新颖的思路和模型。值得一提的是,这些东西又吸引了统计学家的关注,他们把同样的问题又用统计学方法做了出来。再结合一些传统的回归模型,统计学出现了新的分支:统计学习。最后是商学类,现阶段来说比重最小,不过其中一些思路也是值得借鉴的,比如博弈论。一些专门的business analytics硕士会结合商业应用来讲统计和计算机方法。
实际的商业分析案例(当然是business analytics)。简单说几个吧:1.生存模型,生物统计最常用的模型,研究疾病的愈合、死亡时间之类的问题,可以用以测试某些药品、治疗手段是否有效。应用到商业中,比如公司对特定人群投放广告,他们通过不同的渠道点击观看,那么需要多久的时间他们才会决定购买?我们定义:消费者不购买=‘活着’,一旦消费即为‘死亡’。接下来的任务就是研究哪个渠道的广告/哪种组合的广告最为有效。2.聚类问题,公司投放过大量广告,做过促销。然后大量消费者前来购买,到底哪些真的看过上述宣传呢?如果这个都不知道如何分析哪个渠道或者哪些渠道的组合最有效?聚类分析就是解决这一类问题的。3.贝叶斯方法,不知你可了解过贝叶斯分析?是统计/机器学习领域很火的方向。主要应用是在建模时候可以把人为的观点融合进模型中去。使得定性和定量分析的结果结合起来。这一点很是受在business analysis领域做数据分析的人的欢迎。除此外还有很多,就不一一说了。
最后说到你的近况。本科背景还是弱了点,想要接触上述类型的工作,你需要更进一步。并且想吃的开最好也不要限制在统计学领域,毕竟读一个偏应用的学科,学会从应用角度考虑问题对于职业发展更有好处。升学的话可以考虑data analytics/business analytics的硕士专业。不过,如果觉得学费太高的话,其实统计硕士也是个不错的选择。自学的话,coursera上也有很多不错的课程。至于R/Python/SAS嘛,能会一个就够了。数据分析级别的编程,会一个,别的看个把礼拜就能上手。
最后的最后,分享一个链接:Graate Programs in Big Data Analytics and Data Science。里面列举了全世界各地高校开设的数据分析类的研究生专业、各种收费的/不收费的在线课程。
㈢ 知乎上有哪些数据分析的大牛
用表单大师做数据管理和分析,你自己就是大牛!操作简单,通过简单拖崽就可以操作了,无需技术背景支撑都可以用。利用表单大师的报表可以生成图形化的多维度分析。
㈣ 数据分析和web后端选哪个 知乎
WEB开发中“前端”和“后端”的区别如下:
一、Web前端:
1)精通HTML,能够书写语义合理,结构清晰,易维护的HTML结构。
2)精通CSS,能够还原视觉设计,并兼容业界承认的主流浏览器。
3)熟悉JavaScript,了解ECMAScript基础内容,掌握1~2种js框架,如JQuery
4)对常见的浏览器兼容问题有清晰的理解,并有可靠的解决方案。
5)对性能有一定的要求,了解yahoo的性能优化建议,并可以在项目中有效实施。
二、Web后端:
1)精通jsp,servlet,java bean,JMS,EJB,Jdbc,Flex开发,或者对相关的工具、类库以及框架非常熟悉,如Velocity,Spring,Hibernate,iBatis,OSGI等,对Web开发的模式有较深的理解
2)练使用oracle、sqlserver、mysql等常用的数据库系统,对数据库有较强的设计能力。
3)熟悉maven项目配置管理工具,熟悉tomcat、jboss等应用服务器,同时对在高并发处理情况下的负载调优有相关经验者优先考虑
4)精通面向对象分析和设计技术,包括设计模式、UML建模等
5)熟悉网络编程,具有设计和开发对外API接口经验和能力,同时具备跨平台的API规范设计以及API高效调用设计能力
-
㈤ 数据分析和数据挖掘的区别 知乎
1、数据析重点观察数据数据挖掘重点数据发现知识规则KDD(Knowledge Discover in Database);
2、数据析结论智能结数据挖掘结论机器习集(或训练集、本集)发现知识规则;
3、数据析结论运用智力数据挖掘发现知识规则直接应用预测
4、数据析能建立数模型需要工建模数据挖掘直接完数建模传统控制论建模本质描述输入变量与输变量间函数关系数据挖掘通机器习自建立输入与输函数关系根据KDD规则给定组输入参数组输量
-
㈥ 知乎机构号账户怎么做数据分析
肯定要先确定一下你想做什么,也就是需要分析什么。例如分一下大家都爱看什么类型的消息这种。
然后就走个平台呗,中小企业或个人很难具备大数据分析能力,想更专业更准确还是找专业的大数据公司吧,例如前嗅,网页链接
要是找数据公司就简单了,说需求,然他们做,一般也就三两天就能出结果。
㈦ 如何快速成为一名数据分析师知乎
第一、对数据要有一定的敏感度。
第二、熟悉数据相关的各种公式和规律,能熟练地对数据进行归类总结。
第三、了解数据分析师的主要工作内容,围绕该内容深入了解。
满意请采纳,谢谢!
㈧ 数据分析除了excel还有什么工具知乎
想对比分析团队里10个销售经理业绩完成的情况,要出10张图表一一对比,这也太麻烦了吧?
店铺有成百上千个SKU,老板要对比查看每个SKU的销售数据,难道要我做N个图表吗?
负责的网站有几十个推广渠道,想一一对比每个渠道的转化效果,一张图表展示不了效果肿么办?
类似的“痛苦”很多人都遇到过,当涉及到数据多维度对比分析时,比如上面的例子:不同日期维度不同地域维度的数值对比,往往一张数据图表并不能直观地展示效果,又不想直接用表格呈现一“坨”数据,这时”对比拆分”功能就显得尤为重要!
介绍“对比拆分”之前,先普及一下维度、对比、数值(数据小白一定要看,大神可以忽视)是什么:
维度:是事物或现象的某种特征,可以简单理解是X轴,如性别、地区、时间等都是维度。其中时间是一种常用的维度,时间前后的对比称为纵比,如用户数环比上月增长10%;同级单位之间的比较,简称横比,如不同省份人口数的比较、不同公司收入的比较;
对比:当横比、纵比都要涉及的时候(如不同日期不同地域),就需要对比啦!
数值:即指标/度量,用于衡量事物发展程度的单位,可以简单理解是Y轴;
鉴于对比拆分的定义比较抽象,这里先不做解释,主要结合文章开头的2个实际场景来展示其使用价值,希望能真正帮到需要的yin!
工作场景1:O2O/电商网站想要了解近期各省市的订单金额分布情况,需要的维度:日期、地区,需要的数值:订单金额
“美颜”前各省的数据堆在一起,N条折线就像一团杂乱的毛线,数据给人的感觉也是一团乱,根本不想看,也无从下手,更别说用数据驱动运营了。
再看看“美颜”后的图表,很清晰地展示各个省份的数据量和变化趋势,图表瞬间转成小清新,感觉美美哒!连老板都夸我,好开心~
赶紧来看看“美颜”过程:
第1步:打开最爱的BDP,上传需要分析的工作表,在编辑图表页面将日期(付款日期)拉到维度栏、地区(收货省份)拉到对比栏,订单金额拉到数值栏,记得顺手调个稀饭的颜色;
第2步:在右下方勾选“按对比拆分”,瞬间就出现多个动图啦!不喜欢默认的显示,还可以寄已调整单屏显示的行列数量哦~
酷炫的亮点来了:当你把鼠标hover到数据上,同时按下alt键,就能看某一天各省市的数据啦!
㈨ 怎么利用知乎上的热门做数据分析
㈩ 如何对一份数据进行分析 论文 知乎
汇调研(专业的第三方市场调研服务提供商)
先说说写一份好的数据分析报告的重要性,很简单,因为分析报告的输出是你整个分析过程的成果,是评定一个产品、一个运营事件的定性结论,很可能是产品决策的参考依据,既然这么重要那当然要写好它了。
一份好的分析报告,有以下一些要点:
首先,要有一个好的框架
跟盖房子一样,好的分析肯定是有基础有层次,有基础坚实,并且层次明了才能让阅读者一目了然,架构清晰、主次分明才能让别人容易读懂,这样才让人有读下去的欲望;
第二,每个分析都有结论,而且结论一定要明确
如果没有明确的结论那分析就不叫分析了,也失去了他本身的意义,因为你本来就是要去寻找或者印证一个结论才会去做分析的,所以千万不要忘本舍果;
第三,分析结论不要太多要精
如果可以的话一个分析一个最重要的结论就好了,很多时候分析就是发现问题,如果一个一个分析能发现一个重大问题,就达到目的了,不要事事求多,宁要仙桃一口,不要烂杏一筐,精简的结论也容易让阅者接受,减少重要阅者(通常是事务繁多的领导,没有太多时间看那么多)的阅读心理门槛,如果别人看到问题太多,结论太繁,不读下去,一百个结论也等于0;
第四,分析结论一定要基于紧密严禁的数据分析推导过程
不要有猜测性的结论,太主观的东西会没有说服力,如果一个结论连你自己都没有肯定的把握就不要拿出来误导别人了;
第五,好的分析要有很强的可读性
这里是指易读度,每个人都有自己的阅读习惯和思维方式,写东西你总会按照自己的思维逻辑来写,你自己觉得很明白,那是因为整个分析过程是你做的,别人不一定如此了解,要知道阅者往往只会花10分钟以内的时间来阅读,所以要考虑你的分析阅读者是谁?他们最关心什么?你必须站在读者的角度去写分析邮件;
第六,数据分析报告尽量图表化
这其实是第四点的补充,用图表代替大量堆砌的数字会有助于人们更形象更直观地看清楚问题和结论,当然,图表也不要太多,过多的图表一样会让人无所适从;
第七,好的分析报告一定要有逻辑性
通常要遵照:1、发现问题–2、总结问题原因–3、解决问题,这样一个流程,逻辑性强的分析报告也