㈠ 如何利用python進行高通量測序數據的分析 知乎
建議讀兩本書:
1、集體智慧編程 (豆瓣)
因為Python是一門不需要花太多精力(甚至可以說很少),就可以基本掌握的一門語言,所以推薦這本書。題主提到以後想學機器學習,這是一本非常好的入門書,書中的例子源碼都是Python實現的,並且能幫你迅速熟悉Python相關的各種計算庫。
2、統計學習方法 (豆瓣)
考慮到題主要學得踏實,這本書深入淺出地講了和機器學習有關的一切數學基礎知識,一整本的干貨,沒有廢話,非常值得一讀。題主數學專業的話,讀起來應該會比我更順暢。
㈡ essec商業數據分析科學專業怎麼樣知乎
作者:知乎用戶
鏈接:https://www.hu.com/question/36214681/answer/66483598
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。
從商業分析說起吧。關注過不少知乎上類似的問題和回答,發現個較嚴重的問題:大多數人對商業分析這個行業的認知並不準確。具體說來商業分析有兩種:
1. Business analysis. 應屬於傳統商科,主要是任務是對公司整個運營的流程、業務的開展等方面的分析。比如發現新的商業需求、提出/改善某些商業問題的解決方案。它可能包括公司組織上的變更,業務流程的改善,策略性的規劃,政策的制定和提高。這個領域需要一定的數據分析,一方面因為公司發展前期一般主要靠業務的擴展,會涉及一些銷售業績等類似的數據分析。另一方面,大數據時代嘛,很多公司都覺得好像應該順應潮流摻和一把。但總的來說還是business analysis為主。即定性為主導,數據分析(一般較簡單)為輔助。這也是大多數答主所提到的。要在這個領域成長為專業人才,一般會選擇MBA,MBA課程一般也會包含一定的相關課程,但很簡單。
2. Business analytics. 這才是真正的新興學科。翻譯上都叫商業分析,但內容卻差很多,所以特意用英文區分開來。這個行業的核心就是數據分析,而且是高深的技術、模型和演算法。通過對數據的深度分析、挖掘來研究公司以往的業績,對行業市場潛在的商業信息的搜索等。目的是獲取那些通過定性分析和簡單的定量分析根本無法獲得的insights。這個領域逐漸得到了學術界、業界和政府的高度重視:學術界,從紐約大學13年開始開設business analytics的碩士專業以來,全球各大高校紛紛增設相關專業,並且學費直逼MBA,在金錢至上的資本主義國家,高學費往往是高收入和良好職業發展的風向標。業界,更不用說了,BAT都在開設這一類的部門,阿里巴巴去年跟今年就從名校挖了一些這個領域的教授,網路更是把斯坦福大牛Andrew Ng請了來。政府,就我知道的,新加坡和澳洲政府直接撥款贊助開設business analytics部門的公司。
說完基本概念,回到題主問題。仔細讀過問題描述後,我相信題主感興趣的應該是business analytics吧(不是的話,就請忽略以下吧)。那再深入一點講一下相關的技能。題主是統計本科生,很好!哈哈!我是統計博士,現在在紐約一家投資管理公司做類似的工作,同事不乏一些計算機、自動控制、信號處理等數據分析相關的領域的博士。總體來說business analytics無疑是個交叉學科,包括數學(統計)、計算機和商學(經濟學、市場營銷,博弈論等等)。統計類的方法佔據了數據分析學科的首要地位(主要是回歸模型)。可以說如果把統計方法全部拿走,數據科學基本就支離破碎不成體系了。然後是計算機(包括機器學習、模式識別、圖像處理等一類的領域),基於一些應用層面的需求,計算機領域提出了一些新穎的思路和模型。值得一提的是,這些東西又吸引了統計學家的關注,他們把同樣的問題又用統計學方法做了出來。再結合一些傳統的回歸模型,統計學出現了新的分支:統計學習。最後是商學類,現階段來說比重最小,不過其中一些思路也是值得借鑒的,比如博弈論。一些專門的business analytics碩士會結合商業應用來講統計和計算機方法。
實際的商業分析案例(當然是business analytics)。簡單說幾個吧:1.生存模型,生物統計最常用的模型,研究疾病的癒合、死亡時間之類的問題,可以用以測試某些葯品、治療手段是否有效。應用到商業中,比如公司對特定人群投放廣告,他們通過不同的渠道點擊觀看,那麼需要多久的時間他們才會決定購買?我們定義:消費者不購買=『活著』,一旦消費即為『死亡』。接下來的任務就是研究哪個渠道的廣告/哪種組合的廣告最為有效。2.聚類問題,公司投放過大量廣告,做過促銷。然後大量消費者前來購買,到底哪些真的看過上述宣傳呢?如果這個都不知道如何分析哪個渠道或者哪些渠道的組合最有效?聚類分析就是解決這一類問題的。3.貝葉斯方法,不知你可了解過貝葉斯分析?是統計/機器學習領域很火的方向。主要應用是在建模時候可以把人為的觀點融合進模型中去。使得定性和定量分析的結果結合起來。這一點很是受在business analysis領域做數據分析的人的歡迎。除此外還有很多,就不一一說了。
最後說到你的近況。本科背景還是弱了點,想要接觸上述類型的工作,你需要更進一步。並且想吃的開最好也不要限制在統計學領域,畢竟讀一個偏應用的學科,學會從應用角度考慮問題對於職業發展更有好處。升學的話可以考慮data analytics/business analytics的碩士專業。不過,如果覺得學費太高的話,其實統計碩士也是個不錯的選擇。自學的話,coursera上也有很多不錯的課程。至於R/Python/SAS嘛,能會一個就夠了。數據分析級別的編程,會一個,別的看個把禮拜就能上手。
最後的最後,分享一個鏈接:Graate Programs in Big Data Analytics and Data Science。裡面列舉了全世界各地高校開設的數據分析類的研究生專業、各種收費的/不收費的在線課程。
㈢ 知乎上有哪些數據分析的大牛
用表單大師做數據管理和分析,你自己就是大牛!操作簡單,通過簡單拖崽就可以操作了,無需技術背景支撐都可以用。利用表單大師的報表可以生成圖形化的多維度分析。
㈣ 數據分析和web後端選哪個 知乎
WEB開發中「前端」和「後端」的區別如下:
一、Web前端:
1)精通HTML,能夠書寫語義合理,結構清晰,易維護的HTML結構。
2)精通CSS,能夠還原視覺設計,並兼容業界承認的主流瀏覽器。
3)熟悉JavaScript,了解ECMAScript基礎內容,掌握1~2種js框架,如JQuery
4)對常見的瀏覽器兼容問題有清晰的理解,並有可靠的解決方案。
5)對性能有一定的要求,了解yahoo的性能優化建議,並可以在項目中有效實施。
二、Web後端:
1)精通jsp,servlet,java bean,JMS,EJB,Jdbc,Flex開發,或者對相關的工具、類庫以及框架非常熟悉,如Velocity,Spring,Hibernate,iBatis,OSGI等,對Web開發的模式有較深的理解
2)練使用oracle、sqlserver、mysql等常用的資料庫系統,對資料庫有較強的設計能力。
3)熟悉maven項目配置管理工具,熟悉tomcat、jboss等應用伺服器,同時對在高並發處理情況下的負載調優有相關經驗者優先考慮
4)精通面向對象分析和設計技術,包括設計模式、UML建模等
5)熟悉網路編程,具有設計和開發對外API介面經驗和能力,同時具備跨平台的API規范設計以及API高效調用設計能力
-
㈤ 數據分析和數據挖掘的區別 知乎
1、數據析重點觀察數據數據挖掘重點數據發現知識規則KDD(Knowledge Discover in Database);
2、數據析結論智能結數據挖掘結論機器習集(或訓練集、本集)發現知識規則;
3、數據析結論運用智力數據挖掘發現知識規則直接應用預測
4、數據析能建立數模型需要工建模數據挖掘直接完數建模傳統控制論建模本質描述輸入變數與輸變數間函數關系數據挖掘通機器習自建立輸入與輸函數關系根據KDD規則給定組輸入參數組輸量
-
㈥ 知乎機構號賬戶怎麼做數據分析
肯定要先確定一下你想做什麼,也就是需要分析什麼。例如分一下大家都愛看什麼類型的消息這種。
然後就走個平台唄,中小企業或個人很難具備大數據分析能力,想更專業更准確還是找專業的大數據公司吧,例如前嗅,網頁鏈接
要是找數據公司就簡單了,說需求,然他們做,一般也就三兩天就能出結果。
㈦ 如何快速成為一名數據分析師知乎
第一、對數據要有一定的敏感度。
第二、熟悉數據相關的各種公式和規律,能熟練地對數據進行歸類總結。
第三、了解數據分析師的主要工作內容,圍繞該內容深入了解。
滿意請採納,謝謝!
㈧ 數據分析除了excel還有什麼工具知乎
想對比分析團隊里10個銷售經理業績完成的情況,要出10張圖表一一對比,這也太麻煩了吧?
店鋪有成百上千個SKU,老闆要對比查看每個SKU的銷售數據,難道要我做N個圖表嗎?
負責的網站有幾十個推廣渠道,想一一對比每個渠道的轉化效果,一張圖表展示不了效果腫么辦?
類似的「痛苦」很多人都遇到過,當涉及到數據多維度對比分析時,比如上面的例子:不同日期維度不同地域維度的數值對比,往往一張數據圖表並不能直觀地展示效果,又不想直接用表格呈現一「坨」數據,這時」對比拆分」功能就顯得尤為重要!
介紹「對比拆分」之前,先普及一下維度、對比、數值(數據小白一定要看,大神可以忽視)是什麼:
維度:是事物或現象的某種特徵,可以簡單理解是X軸,如性別、地區、時間等都是維度。其中時間是一種常用的維度,時間前後的對比稱為縱比,如用戶數環比上月增長10%;同級單位之間的比較,簡稱橫比,如不同省份人口數的比較、不同公司收入的比較;
對比:當橫比、縱比都要涉及的時候(如不同日期不同地域),就需要對比啦!
數值:即指標/度量,用於衡量事物發展程度的單位,可以簡單理解是Y軸;
鑒於對比拆分的定義比較抽象,這里先不做解釋,主要結合文章開頭的2個實際場景來展示其使用價值,希望能真正幫到需要的yin!
工作場景1:O2O/電商網站想要了解近期各省市的訂單金額分布情況,需要的維度:日期、地區,需要的數值:訂單金額
「美顏」前各省的數據堆在一起,N條折線就像一團雜亂的毛線,數據給人的感覺也是一團亂,根本不想看,也無從下手,更別說用數據驅動運營了。
再看看「美顏」後的圖表,很清晰地展示各個省份的數據量和變化趨勢,圖表瞬間轉成小清新,感覺美美噠!連老闆都誇我,好開心~
趕緊來看看「美顏」過程:
第1步:打開最愛的BDP,上傳需要分析的工作表,在編輯圖表頁面將日期(付款日期)拉到維度欄、地區(收貨省份)拉到對比欄,訂單金額拉到數值欄,記得順手調個稀飯的顏色;
第2步:在右下方勾選「按對比拆分」,瞬間就出現多個動圖啦!不喜歡默認的顯示,還可以寄已調整單屏顯示的行列數量哦~
酷炫的亮點來了:當你把滑鼠hover到數據上,同時按下alt鍵,就能看某一天各省市的數據啦!
㈨ 怎麼利用知乎上的熱門做數據分析
㈩ 如何對一份數據進行分析 論文 知乎
匯調研(專業的第三方市場調研服務提供商)
先說說寫一份好的數據分析報告的重要性,很簡單,因為分析報告的輸出是你整個分析過程的成果,是評定一個產品、一個運營事件的定性結論,很可能是產品決策的參考依據,既然這么重要那當然要寫好它了。
一份好的分析報告,有以下一些要點:
首先,要有一個好的框架
跟蓋房子一樣,好的分析肯定是有基礎有層次,有基礎堅實,並且層次明了才能讓閱讀者一目瞭然,架構清晰、主次分明才能讓別人容易讀懂,這樣才讓人有讀下去的慾望;
第二,每個分析都有結論,而且結論一定要明確
如果沒有明確的結論那分析就不叫分析了,也失去了他本身的意義,因為你本來就是要去尋找或者印證一個結論才會去做分析的,所以千萬不要忘本舍果;
第三,分析結論不要太多要精
如果可以的話一個分析一個最重要的結論就好了,很多時候分析就是發現問題,如果一個一個分析能發現一個重大問題,就達到目的了,不要事事求多,寧要仙桃一口,不要爛杏一筐,精簡的結論也容易讓閱者接受,減少重要閱者(通常是事務繁多的領導,沒有太多時間看那麼多)的閱讀心理門檻,如果別人看到問題太多,結論太繁,不讀下去,一百個結論也等於0;
第四,分析結論一定要基於緊密嚴禁的數據分析推導過程
不要有猜測性的結論,太主觀的東西會沒有說服力,如果一個結論連你自己都沒有肯定的把握就不要拿出來誤導別人了;
第五,好的分析要有很強的可讀性
這里是指易讀度,每個人都有自己的閱讀習慣和思維方式,寫東西你總會按照自己的思維邏輯來寫,你自己覺得很明白,那是因為整個分析過程是你做的,別人不一定如此了解,要知道閱者往往只會花10分鍾以內的時間來閱讀,所以要考慮你的分析閱讀者是誰?他們最關心什麼?你必須站在讀者的角度去寫分析郵件;
第六,數據分析報告盡量圖表化
這其實是第四點的補充,用圖表代替大量堆砌的數字會有助於人們更形象更直觀地看清楚問題和結論,當然,圖表也不要太多,過多的圖表一樣會讓人無所適從;
第七,好的分析報告一定要有邏輯性
通常要遵照:1、發現問題–2、總結問題原因–3、解決問題,這樣一個流程,邏輯性強的分析報告也