常用的數據分析方法有:聚類分析、因子分析、相關分析、對應分析、回歸分析、方差分析。
1、聚類分析(Cluster Analysis)
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。
2、因子分析(Factor Analysis)
因子分析是指研究從變數群中提取共性因子的統計技術。因子分析就是從大量的數據中尋找內在的聯系,減少決策的困難。因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發抽因法、拉奧典型抽因法等等。
3、相關分析(Correlation Analysis)
相關分析(correlation analysis),相關分析是研究現象之間是否存在某種依存關系,並對具體有依存關系的現象探討其相關方向以及相關程度。
4、對應分析(Correspondence Analysis)
對應分析(Correspondence analysis)也稱關聯分析、R-Q型因子分析,通過分析由定性變數構成的交互匯總表來揭示變數間的聯系。可以揭示同一變數的各個類別之間的差異,以及不同變數各個類別之間的對應關系。對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。
5、回歸分析
研究一個隨機變數Y對另一個(X)或一組(X1,X2,?,Xk)變數的相依關系的統計分析方法。回歸分析(regression analysis)是確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法。
6、方差分析(ANOVA/Analysis of Variance)
又稱「變異數分析」或「F檢驗」,是R.A.Fisher發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。由於各種因素的影響,研究所得的數據呈現波動狀。
想了解更多關於數據分析的信息,推薦到CDA數據認證中心看看,CDA(Certified Data Analyst),即「CDA 數據分析師」,是在數字經濟大背景和人工智慧時代趨勢下,面向全行業的專業權威國際資格認證, 旨在提升全民數字技能,助力企業數字化轉型,推動行業數字化發展。 「CDA 數據分析師」具體指在互聯網、金融、零售、咨詢、電信、醫療、旅遊等行業專門從事數據的採集、清洗、處理、分析並能製作業務報告、 提供決策的新型數據分析人才。
㈡ 數據分析的8個流程與7個常用思路
數據分析的8個流程與7個常用思路
在產品運營過程中,數據分析具有極其重要的戰略意義,是產品優化和產品決策的核心大腦。因此做好數據分析,是產品運營中最重要的環節之一。
那麼如何做好支付的數據分析呢?以下梳理出數據分析的8步流程,以及常見的7種分析思路。新手在啟動數據分析前,最好跟主管或數據經驗較豐富的童鞋確認每一步的分析流程。
一、數據分析八流程:
為什麼分析?
首先,你得知道為什麼分析?弄清楚此次數據分析的目的。比如,這次簡訊方式的數據分析,為什麼要做這個分析。你所有的分析都的圍繞這個為什麼來回答。避免不符合目標反復返工,這個過程會很痛苦。
分析目標是誰?
分析目標是誰? 要牢記清楚的分析因子,統計維度是訂單,還是用戶,還是金額,還是用戶行為。避免把訂單當用戶算,把用戶當訂單算(上周運營同學真實案例),算出的結果是差別非常大的。
想達到什麼效果?
通過分析各個維度的用戶,訂單,找到真正的問題。例如這次的XX通道的分析,全盤下線,或維持現狀不動,都不符合利益最大化原則。通過分析,找到真正的問題根源,發現用戶精細化運營已經非常必要了。
需要哪些數據?
支付的數據,茫茫大海,數據繁多,用「海」來形容一點都不為過。需要哪些源數據?付費總額,付費人數?新老用戶維度?付費次數?轉移人數?留存率?用戶特徵?畫像?先整理好思路,列一個表。避免數據部門同學今天跑一個數據,明天又跑一個數據,數據部門同學也會比較煩。
如何採集?
直接資料庫調取?或者交給程序猿導出? 自己寫SQL?運營同學不妨都學一下SQL,自力更生。
如何整理?
整理數據是門技術活。不得不承認EXCEL是個強大工具,數據透視表的熟練使用和技巧,作為支付數據分析必不可少,各種函數和公式也需要略懂一二,避免低效率的數據整理。Spss也是一個非常優秀的數據處理工具,特別在數據量比較大,而且當欄位由特殊字元的時候,比較好用。
如何分析?
整理完畢,如何對數據進行綜合分析,相關分析?這個是很考驗邏輯思維和推理能力的。同時分析推理過程中,需要對產品了如指掌,對用戶很了解,對渠道很熟悉。看似一個簡單的數據分析,其實是各方面能力的體現。首先是技術層面,對數據來源的抽取-轉換-載入原理的理解和認識;其實是全局觀,對季節性、公司等層面的業務有清晰的了解;最後是專業度,對業務的流程、設計等了如指掌。練就數據分析的洪荒之力並非一朝一夕之功,而是在實踐中不斷成長和升華。一個好的數據分析應該以價值為導向,放眼全局、立足業務,用數據來驅動增長。運營同學比較容易聚在某個點上轉圈走不出來。
如何展現和輸出?
數據可視化也是一個學問。如何用合適的圖表表現?每一種圖表的寓意是什麼?下面列舉下常用的8個圖表:
(1)、折線圖:合適用於隨時間而變化的連續數據,例如隨時間收入變化,及增長率變化。
(2)、柱型圖:主要用來表示各組數據之間的差別。主要有二維柱形圖、三維柱形圖、圓柱圖、圓錐圖和棱錐圖。如支付寶與微信覆蓋率差別。
(3)、堆積柱形圖:堆積柱形圖不僅可以顯示同類別中每種數據的大小,還可以顯示總量的大小。例如我們需要表示各個支付方式的人數及總人數時。
(4)、線-柱圖:這種類型的圖不僅可以顯示出同類別的比較,還可以顯示出趨勢情況。
(5)、條形圖:類似於橫向的柱狀圖,和柱狀圖的展示效果相同,主要用於各項類的比較。
(6)、餅圖:主要顯示各項佔比情況。餅圖一般慎用,除非佔比區別非常明顯。因為肉眼對對餅圖的佔比比例分辨並不直觀。而且餅圖的項,一般不要超過6項。6項後建議用柱形圖更為直觀。
(7)、復合餅圖:一般是對某項比例的下一步分析。
(8)、母子餅圖:可直觀地分析項目的組成結構與比重。例如上次簡訊支付能力用戶中,沒有第3方支付能力的用戶,中間有X%比例是沒銀行卡,X%比例是沒微信支付賬號等。
圖表不必太花哨,一個表說一個問題就好。用友好的可視化圖表,節省閱讀者的時間,也是對閱讀者的尊重。
有一些數據,辛辛苦苦做了整理和分析,最後發現對結論輸出是沒有關系的,雖然做了很多工作,但不能為了體現工作量而堆砌數據。
在展現的過程中,請註明數據的來源,時間,指標的說明,公式的演算法,不僅體現數據分析的專業度,更是對報告閱讀者的尊重。
二、數據分析七思路:
簡單趨勢
通過實時訪問趨勢了解產品使用情況。如總流水,總用戶,總成功率,總轉化率。
多維分解
根據分析需要,從多維度對指標進行分解。例如新老用戶、支付方式、游戲維度、產品版本維度、推廣渠道、來源、地區、設備品牌等等維度。
轉化漏斗
按照已知的轉化路徑,藉助漏斗模型分析總體和每一步的轉化情況。常見的轉化情境有下單率,成功轉化率等。
用戶分群
在精細化分析中,常常需要對有某個特定行為的用戶群組進行分析和比對;數據分析需要將多維度和多指標作為分群條件,有針對性地優化產品,提升用戶體驗。例如我們這次對簡訊這類用戶,簡訊里又有第3方和無第3方支付能力的,需要再進行分群的運營。
細查路徑
數據分析可以觀察用戶的行為軌跡,探索用戶與產品的交互過程;進而從中發現問題、激發靈感亦或驗證假設。例如我們這次對新用戶的運營,也非常有意思。
留存分析
留存分析是探索用戶行為與回訪之間的關聯。一般我們講的留存率,是指「新增用戶」在一段時間內「回訪」的比例。通過分析不同用戶群組的留存差異、使用過不同功能用戶的留存差異來找到產品的增長點。
A/B 測試
A/B測試就是同時進行多個方案並行測試,但是每個方案僅有一個變數不同;然後以某種規則(例如用戶體驗、數據指標等)優勝略汰選擇最優的方案。數據分析需要在這個過程中選擇合理的分組樣本、監測數據指標、事後數據分析和不同方案評估。
不單是支付的數據分析,其他的產品運營數據分析流程和思路也一樣適用,只是支付數據相對其他產品而言,維度很多,以及組合的維度也非常多,因此就需要更清晰的思路和大局觀,避免陷入到數據海洋中。
㈢ 入門必備!數據分析的3大思維和7種技巧
如果我們在分析一個問題前,思維缺失就像下面圖中所表達的一樣,往往不知道問題從哪裡下手,在這個時候就輪到平時鍛煉的數據分析思維了。
結構化
可以看作金字塔思維,把待分析問題按不同方向去分類,然後不斷拆分細化,能全方位的思考問題,一般是先把所有能想到的一些論點先寫出來,然後在進行整理歸納成金字塔模型。主要通過前面介紹的思維導圖來寫我們的分析思維。
公式化
在結構化的基礎上,這些論點往往會存在一些數量關系,使其能進行+、-、×、÷的計算,將這些論點進行量化分析,從而驗證論點 。
業務化
業務化即是深入了解業務情況,結合該項目的具體業務進行分析,並且能讓分析結果進行落地執行。用結構化思考+公式化拆解得出的最終分析論點再很多時候表示的是一種現象,不能體現產生結果的原因。所以需要繼續去用業務思維去思考,站在業務人員或分析對象的角度思考問題,深究出現這種現象的原因或者通過數據推動業務。
增加業務思維方法:貼近業務,換位思考,積累經驗
在數據分析中,三種核心數據分析思維是框架型的指引,實際應用中還是需要很多技巧工具的。7種數據分析技巧,它們分別是象限法,多維法,假設法,指數法,二八法,對比法,漏鬥法。
象限法
通過對兩種維度的劃分,運用坐標的方式表達出想要的價值,由價值直接轉變為策略,從而進行一些落地的推動。象限法是一種策略驅動的思維,廣泛應用於戰略分析,產品分析,市場分析,客戶管理,用戶管理,商品管理等。
下圖是RFM模型,把客戶按最近一次消費(Recency)、消費頻率(Frequency)、消費金額 (Monetary)三個維度分成八個象限。
菜品銷售增長率和銷售利潤
多維法
多維法是指對分析對象從多個維度去分析,這里一般是三個維度,每個維度有不同數據分類,這樣代表總數據的大正方體就被分割成一個個小方塊,落在同一個小方塊的數據擁有同樣的屬性,這樣可以通過對比小方塊內的數據進行分析。如圖,這是一個快餐店的外賣訂單多維表:
雖然只有下單時間、菜品名稱、平台三個維度。但根據這個立方體,已經能解決很多掌櫃急需了解的問題了。
我們可以通過切片實現每個平台每種菜品的銷量,每個月每種菜品的銷量,某個月某平台菜品銷售情況等等操作。
假設法
在一些情況下,如進入新市場的銷量、商品提價後銷量的變化情況,可能沒有明細數據進行分析,那麼就需要用到假設法。假設法也就是假設一個變數或者比率成立,然後根據部分數據進行反推,這是一種啟發思維的技巧,一般過程是先假設後驗證然後判斷出分析結果。
例題:你是自營電商分析師,現在想將商品提價,你分析下銷售額會有怎樣的變化?解答思路:首先可以確定銷量會下降,那麼下降多少?這里就要假設商品流量情況,提價後轉化率的變化情況,然後根據歷史數據匯總出銷量下降百分百,從而得出銷售額的變化情況。
指數法
指數法是把某個數據多個指標按一定的計算轉化為同度量的一個值,這個度量值稱為指數。例如在一場游戲競技比賽中要確定該場的MVP,則是需要根據擊殺數、死亡數、助攻數、經濟、補兵等指標進行綜合計算出一個得分,得分高的為MVP。
指數法常用的有線性加權、反比例、log三種。線性加權即是把每個指標乘以一個系數後相加,反比例即是用數學上的反比例函數y=k/x變化後在計算,log即是數學中所說的對數一般以2為底數或者10為底數。指數法使用沒有統一標准,一般是根據經驗來做,將無法利用的數據加工成可以可利用的。例如,NBA計算最有價值球員的指數參考:
二八法
二八法即是二八法則也可以叫做帕累托法則,比如在個人財富上可以說世界上20%的人掌握80%的財富。而在數據分析中,則可以理解為20%的數據產生了80%的效果需要圍繞這20%的數據進行挖掘。往往在使用二八法則的時候和排名有關系,排在前20%的才算是有效數據。二八法是抓重點分析,適用於任何行業。找到重點,發現其特徵,然後可以思考如何讓其餘的80%向這20%轉化,提高效果。
對比法
對比法就是用兩組或兩組以上的數據進行比較,常見的是用於在時間維度上的同比和環比、定基比,與競爭對手的對比、類別之間的對比、特徵和屬性對比等。對比法可以發現數據變化規律,使用非常頻繁,多與前面的技巧結合使用。
漏鬥法
漏鬥法即是漏斗圖,有點像倒金字塔,是一個流程化思考方式,常用於像新用戶的開發、購物轉化率這些有變化和一定流程的分析中。不過,單一的漏斗分析是沒有用的,不能得出什麼結果,要與其它相結合,如與歷史數據的對比等。
下圖我用BI商業智能工具FineBI連接了CRM系統的數據,對客戶的行為數據做了漏斗圖形式的展現。
最後,說了這么多方法,趕緊拿起小本本記下來吧!
㈣ 數據分析思路都有哪些
1、趨勢分析最簡單、最常見的數據分析方法,一般用於核心指標的長期跟蹤,比如點擊率、GMV、活躍用戶數。可以看出數據有那些趨勢上的變化,有沒有周期性,有沒有拐點等,繼而分析原因。
2、多維分解
也就是通過不同的維度對於數據進行分解,以獲取更加精細的數據洞察。舉個例子,對網站維護進行數據分析,可以拆分出地區、訪問來源、設備、瀏覽器等等維度。
3、用戶分群
針對符合某種特定行為或背景信息的用戶,進行特定的優化和分析,將多維度和多指標作為分群條件,有針對性地優化供應鏈,提升供應鏈穩定性。
4、漏斗分析
按照已知的轉化路徑,藉助漏斗模型分析總體和每一步的轉化情況。例如將漏斗圖用於網站關鍵路徑的轉化率分析,不僅能顯示用戶的最終轉化率,同時還可以展示每一節點的轉化率。
5、留存分析
留存分析是一種用來分析用戶參與情況/活躍程度的分析模型,考察進行初始行為的用戶中,有多少人會進行後續行為。衡量留存的常見指標有次日留存率、7日留存率、30日留存率等。
6、A/B 測試
A/B測試是為了達到一個目標,採取了兩套方案,通過實驗觀察兩組方案的數據效果,判斷兩組方案的好壞,需要選擇合理的分組樣本、監測數據指標、事後數據分析和不同方案評估。
7、對比分析
分為橫向對比(跟自己比)和縱向對比(跟別人比),常見的對比應用有A/B test,A/B test的關鍵就是保證兩組中只有一個單一變數,其他條件保持一致。
8、交叉分析
交叉分析法就是將對比分析從多個維度進行交叉展現,進行多角度的結合分析,從中發現最為相關的維度來探索數據變化的原因。