Ⅰ 數據流程分析的包括的內容
數據來源:數據分析的對象是數據,數據從哪來?數據本身的准確性從根本上影響著分析結果的有效性,所以確保有效、靠譜的數據來源至關重要。本人認為數據來源無非以下三種:
a.自有數據分析系統——公司自有的數據是最源質化的數據,也是最可靠、最全面的。一般而言,有條件的情況下都是以內部數據為准;當然,創業型的微型公司大多都直接資料庫導出數據,還是要依賴產品經理二次加工的。
b.定量/定性調研——沒有全面的數據咋辦?或者說想要分析的數據無法統計?那麼,拿起電話、走上街頭、發放問卷都不失為一種可行的辦法。定量數據排斥主管因素,定性數據吸納主管因素。事實上,定性數據存在諸多不確定性,但也存在一個其他數據指標不具備的優勢——那是與真實用戶交流所得,有血有肉。
c.專業調研機構——知名調研機構,比如:艾瑞咨詢、網路統計、易觀智庫、199IT-互聯網數據中心。一般而言,權威結構統計調研的數據還是具有極強的參考性的,但也不能完全免於主觀因素。
數據分析:單純的數據並不能為給我們帶來太多結論性的東西,還是要藉助一定的方法和手段將數據變得更加生動和有意義。
a.集成開發數據分析系統——將所需的數據指標以技術手段直接設計成產品功能,可以定期定量地直接生成導出BI報表。
b.手動數據加工——面對元數據而不是現成的結論性數據,產品經理只能親自操刀藉助EXCEL各種函數。面對海量數據,心態很重要!
c.委託分析機構——有錢、任性、夠叼,請人分析。如果事事都依靠別人,那麼產品經理就瞬間失去價值了...
分析方法:有效的數據分析方法能夠深度挖掘數據的價值,精益數據分析中大致介紹以下三種分析方法。
a.市場細分(Segmentation)——市場細分就是一群擁有某種共同特徵的劃為一個樣本,市場細分不盡可以應用於互聯網產品,對任何行業、任何形式的產品都具有積極的參考意義。
b.同期群分析(Coghort Analysis)——比較相似群體隨時間的變化,同期群分析給我們提供了一個全新的視角。能夠觀察處於生命周期不同階段用戶的行為模式,而非忽略用戶的行為的過程性。
c.多變數測試(Multivariate Testing)——同時對多個因素進行分析,用統計學的方法剝離出單個影響要與結果中的某一項指標提升的關聯性。同時改動產品的多個方面,看哪個與結果的相關性最大。
Ⅱ 一次完整的數據分析流程包括哪些環節
一次完整的數據分析流程主要分為六個環節,包括明確分析目的、數據獲取、數據處理、數據分析、數據可視化、提出建議推動落地
做任何事情都有其對應的目的,數據分析也是如此。每一次分析前,都必須要先明確做這次分析的目的是什麼,只有先明確了目的,後面的分析才能圍繞其展開。常見的數據分析目標包括以下三種類型:
波動解釋型:某天的銷售額突然下降了,某天的新用戶留存突然降低了,這時候往往需要分析師去解釋波動的原因,分析較為聚焦,主要是找到波動的原因。
數據復盤型:類似於月報、季報,在互聯網領域常見於app某某功能上線了一段時間後,數據分析師往往需要復盤一下這個功能的表現情況,看看有沒有什麼問題。
專題探索型:對某個主題發起的專項探索,比如新用戶流失、營收分析等等
在明確的分析目標後,就可以根據目標去獲取所需要的數據,數據獲取主要可以分為外部數據和內部數據兩類:可以外部數據和內部數據兩類:
外部數據
想要獲取外部數據,一是可以從公開的數據網站上查詢,比如對於戰略分析師,在研究進入某個地區或某個國家的策略時,往往就需要獲取對應地區、國家的數據
第二種獲取外部數據的方法就是爬蟲,這陸盯種方法會更加靈活,不過現在做爬蟲會有一定的法律風險。
內部數據
內部數據是企業自身內部的數據,對於互聯網行業,用戶行為的數據是通過埋點的形式上報獲取,最終儲存在hive表中,作為數據分析師,需要用sql去把數據提取出來。
數據處理階段主要的目的是解決數據質量的問題,在數據採集環節中,內部的數據往往質量較好,但是外部數據,比如爬蟲獲取的數據,數據往往會比較雜亂,俗稱「臟數據」,需要進行數據清洗,包括補全缺失值、刪去異常值、重復值、進行數據轉換等等
1 、異常值處理
什麼是異早此和常值?下面就是一個很明顯的異常值的例子,這種異常值在我們進行分析時候,比如回歸分析,這種值往往都要刪掉,不然會對結果產生很大的影響。但是並不是所有情況異常值都要刪掉,不同領域對異常值的處理方法不同,比如在風控領域,反而要重點關注異常值,因為大部分用戶都是正常的,異常值可能就是作弊用戶。
2、補全缺失值
有缺失值怎麼辦,補上。常見的補缺失值的辦法包括:
1. 通過其他信息填補,比如通過身份證補充生日、籍貫等
2. 將樣本進行分類,然後以該類中樣本的均值、中位數補全
數據處理好了之後,就可以開始分析,根據你的分析目標,要選擇合適的分析方法。常見的分析方法包括:
描述性分析
推斷性分析
探索性分析
通過數據分析得出結論後,還需要用圖表展示出來,俗話說得好,「文不如表,表不如圖",用圖表可以更清晰展現你的結論。
基於你的分析目標得出結論後,數據分析師還應根據你的結論提出相對應的改進建議,並推動建議落地,這樣才能完成一個完整的數據分析閉環。比如你發現新用戶流失高的原因是因為某個新用戶引導的節點有問題,那麼可以提出對應的建議,比如產品應該如何改進這個節點。
在你的策略實施後,發現新用戶的流失率顯著下降,這樣就完成了一次完扒槐整的數據分析,通過分析改進了業務。