1. 數據分析必讀干貨:簡單而實用的3大分析方法
導讀:數據分析師需要哪些「專業技能」?如果有人建議你去學習R語言、tableau、PowerBI,那麼我建議你不如先從最基礎也是最核心的數據分析方法學起。
在一家年銷售不到10億的電商公司(行業中大部分電商企業年銷售可能都不到1個億),你只要掌握一些基礎的數據分析方法,再配合Excel表格,就足夠你完成各種數據化運營工作了。
本文主要講解日常數據分析中,最常用的三大數據分析方法 。內容雖然簡單,但是其中充滿了大量的細節方面的實用技巧。
01 對比
對比是所有數據分析方法中最基礎,也是大家耳熟能詳的一個。俗話說,無對比,不分析。說的就是對比分析法了。
在實際分析場景中,對比有不同的應用維度。比如有環比、同比、橫比、縱比、絕對值對比,相對值對比等。下面我們分別解釋一下它們的不同應用場景。
1. 絕對值對比與相對值對比
從概念上而言,絕對值包含正數、負數和零值。在電商數據分析中,一般是指正數之間的對比較多,如銷售額、退貨額等;相對值對比,則是指轉化率、完成率等這類相對數之間的對比。
2. 環比
環比是指統計周期內的數據與上期數據的比較,比如2017年6月數據與2017年5月數據的比較。
在電商數據分析中,由於每個自然月之間的銷售差額比較大,如果採用絕對指標,便很難通過對比觀察到業務的變化。
因此,一般會採用相對指標來做環比分析,如2017年6月的銷售達標率是102%,2017年5月的銷售達標率是96%;這樣便很容易知道兩個月度之間轉化率的好壞優劣了。然而,如果我們用絕對值來對比:2017年6月銷售額500萬,2017年5月銷售額300萬,這樣的對比便很難判斷究竟哪個月的銷售額完成得更好。
3. 同比
同比是指統計周期內數據與去年同期數據之間的對比,比如2017年6月銷售額是500萬,2016年6月銷售額是450萬,同比增加11.1%。
在電商分析中,同比是應用最廣泛的數據分析方法。通過同比,我們能大致判斷店鋪的運營能力在最近一年中,是保持增長還是呈下滑趨勢。
同時,也可以根據同比增長趨勢,來制訂初步的銷售計劃。如表3-4所示,假設現在店鋪流量同比下降8%(流量下降是平台趨勢),客單價保持不變的情況下,要想實現店鋪銷售業績的上升,唯有提升轉化率。
因此,我們通過表3-4的模擬推算,可以得知,當轉化率提升21%,到達0.35%時(0.35%轉化率被認為是行業的平均值),業績會提升11%。
▼表3-4 店鋪銷售計劃推算模擬表
4. 橫向對比與縱向對比
所謂橫向對比與縱向對比,是指空間與時間兩個不同的維度之間的對比。橫向對比是空間維度的對比,指同類型的不同對象在統一的標准下進行的數據對比。如「本店」與「競品」之間的對比;縱向對比是時間維度的對比,指同一對象在不同時間軸上的對比。如前面提到的「同比」「環比」都是縱向對比。
5. 份額
嚴格地說,「份額」屬於橫向對比的一種。由於在實際分析場景中它經常會被忽略,因此單獨羅列出來,加以說明。
在某些情況下,數據表格中多一個「份額」,會讓表格清晰明了許多。
如表3-5所示,假設我們要分析「某品牌天貓、京東、唯品會三大渠道」的「上衣、下衣、連衣裙和其他」在「Q1~Q4季度」的銷售趨勢和表現。常規的分析方法是,按照表1的表格結構,將各種數據有層次地展現出來。這時,所有的銷售數據在表格中可以層次分明地一覽無余。
▼表3-5 以份額處理的數據表格
但是,如表1這般的數據卻不能直觀告訴我們每個銷售類別在不同渠道和不同季度的銷售趨勢是什麼。因此,在數據分析中便需要加入表2這樣的「份額」分析表格。如此,我們便可一目瞭然地掌握每個類別在不同渠道、不同時期的銷售趨勢。因此也就達到了數據分析的目的。
很多數據分析師往往只是完成了「表1」的分析步驟,卻缺少臨門一腳,沒有把「表2」也同步呈現出來。
02 細分
細分,是一種從概念上理解非常容易,但實際應用起來卻很難的分析方法。
細分分析法,常用於為分析對象找到更深層次的問題根源。難點在於我們要理解從哪個角度進行「細分」與「深挖」才能達到分析目的。就好像高中課程中解幾何題一樣,如果找對了「解題思路」,問題就迎刃而解;如果「解題思路」錯了,勞心費力不說,問題還解決不了。
在實際應用中,細分有許多不同的方法,就如同我們在解題時,有各種不同的「解題思路」一樣。有時候,面對同一個問題,兩個不同的解題思路都可以達到解題的目的;但更多時候,只有唯一正確的解題思路才可以正確地解題。所以,在分析之前,選擇正確的『細分』方法便非常重要。
下面,我們就具體來看一下,在細分分析中,有哪些解題思路。
1. 分類分析
就是指對所有需要被分析到的數據單元,按照某種標准打上標簽,再根據標簽進行分類,然後使用匯總或者對比的方法來進行分析。
在服裝行業中,常用於做分類分析的標簽有「類目」「價格帶」「折扣帶」「年份」「季節」等。
通過從「年份」「季節」的維度來對商品庫存進行細分,我們可以輕松地知道有多少貨屬於「庫存」,有多少貨屬於「適銷品」;
通過從「折扣帶」的維度來對銷售流水進行細分,我們可以大致知道店鋪的盈利情況;
通過從「類目」的維度對銷售流水和庫存同時進行細分,我們可以知道統計周期內品類的銷售動態與庫存滿足度。
2. 人—貨—場
「人—貨—場」能夠為人提供宏觀視野的分析。其原理類似於分類分析,即將所有需要被分析到的數據單元,打上「人」「貨」「場」的標簽,然後再進行相應的數據分析與處理。
在實際應用場景中,「人—貨—場」分析法往往被靈活運用在初步診斷某一競品店鋪時。
如圖3-3所示是利用「人—貨—場」邏輯方法來分析競品店鋪的主流思路。在分析之前,先把「解題思路」用「人—貨—場」的方式羅列出來,把所有能夠想到的有用的「分支」都羅列出來,然後查漏補缺、標注重要與非重要。最後,再按此「解題思路」來進行分析。便可達到事半功倍的分析效果。
▲圖3-3 利用「人—貨—場」細分方法初步分析競品店鋪
3. 杜邦分析法
細分分析方法中,還有一種知名的分析方法,叫「杜邦分析法」。在電商數據分析中,杜邦分析也是常被使用的分析方法之一。
網路中對杜邦分析的解釋是:「杜邦分析法(DuPont Analysis)是利用幾種主要財務比率之間的關系來綜合分析企業的財務狀況。具體來說,它是一種用來評價公司盈利能力和股東權益回報水平,從財務角度評價企業績效的一種經典方法。」由此可見,杜邦分析主要是用於企業的財務分析之中。
但是在電商中,杜邦分析常被用於尋找銷售變化的細小因素之中。如圖3-4所示,便是根據杜邦分析原理,將所有影響到銷售額的量化指標都統計出來的一種常用分析方法。此種方法,有助於我們從細小的數據顆粒中找到影響銷售變化的元素。
▲圖3-4 銷售變化的原因分析
03 轉化
轉化分析是電商、游戲等互聯網行業的特定分析方法,在傳統行業的零售分析中並不常見。轉化分析常用於頁面跳轉分析、用戶流失分析等業務場景。
轉化分析的表現形式一般是選用漏斗模型,如圖3-5所示,便是模擬了某電商店鋪的流量轉化情況,並以漏斗圖的形式展現出來。
▲圖3-5 電商常見的流量轉化漏斗圖
這張圖模擬了從店鋪的瀏覽商品人數到加購人數,然後生成訂單、支付訂單,直到最後支付成功的漏斗示意圖。
從圖3-5的示例中,反推「轉化」分析方法,我們應該得到以下結論:
轉化分析方法的前提,是我們需要首先確定一條「轉化路徑」(如圖3-5左側的路徑所示),這條路徑就是我們的「解題方法」,是決定我們接下來的分析能否達成目標的重要因素。
當「轉化路徑」確定後,我們需要把「路徑」中的各個「節點」羅列出來,並把節點下的重要數據統計出來。
最後,根據路徑把各節點的數據用漏斗圖的形式表達出來。
同時,轉化分析還可用於店鋪微觀方面的「轉化」洞察。譬如在某一次店鋪舉行大促活動時,我們需要分析大促期間「活動二級頁」的流量轉化效果如何。此時,我們便可以參照如圖3-6所示的漏斗模型。
▲圖3-6 活動頁效果分析的漏斗圖
在以上案例中,我們將轉化路徑定義為「活動頁→詳情頁→支付頁面(下單)→支付成功(購買)」四個節點。然後統計每個頁面的流量到達數量,於是得出如圖3-6所示的漏斗圖。
通過此圖,可以清晰明確地診斷出此次活動二級頁在「下單→付款」環節轉化率僅40%,存在一定問題。在支付界面的流量跳失,很可能是價格過高所致。
本文摘編自《電商數據分析與數據化運營》,經出版方授權發布。
2. 數據分析的分析方法有哪些
數據分析的分析方法有:
1、列表法
將數據按一定規律用列表方式表達出來,是記錄和處理最常用的方法。表格的設計要求對應關系清楚,簡單明了,有利於發現相關量之間的相關關系;此外還要求在標題欄中註明各個量的名稱、符號、數量級和單位等:根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。
2、作圖法
作圖法可以最醒目地表達各個物理量間的變化關系。從圖線上可以簡便求出實驗需要的某些結果,還可以把某些復雜的函數關系,通過一定的變換用圖形表示出來。
圖表和圖形的生成方式主要有兩種:手動製表和用程序自動生成,其中用程序製表是通過相應的軟體,例如SPSS、Excel、MATLAB等。將調查的數據輸入程序中,通過對這些軟體進行操作,得出最後結果,結果可以用圖表或者圖形的方式表現出來。
圖形和圖表可以直接反映出調研結果,這樣大大節省了設計師的時間,幫助設計者們更好地分析和預測市場所需要的產品,為進一步的設計做鋪墊。同時這些分析形式也運用在產品銷售統計中,這樣可以直觀地給出最近的產品銷售情況,並可以及時地分析和預測未來的市場銷售情況等。所以數據分析法在工業設計中運用非常廣泛,而且是極為重要的。
(2)數據分析軟體的方法與技巧擴展閱讀:
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解並消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
數據分析的數學基礎在20世紀早期就已確立,但直到計算機的出現才使得實際操作成為可能,並使得數據分析得以推廣。數據分析是數學與計算機科學相結合的產物。
3. 數據分析的方法
數據分析通常包括以下幾個步驟:
數據收集:獲取需要分析的數據,可以是從各種數據源收集數據或者自己採集數據。
數據清洗:對數據進行清理和整理,包括去除重復數據、缺失數據、異常數據、格式轉換等操作,使數據能夠被更好地分析和利用。
數據探索:對數據進行可視化展示和統計分析,探索數據的分布、特徵、關系和趨勢等。
數據建模:根據數據分析的結果,利用統計學方法或機器學習演算法構建模型,用於預測和分析未來的數據情況。
數據解釋:將數據分析的結果進行解釋和應用,為決策提供支持和參考。
而對於更具體的數據分析方法,我將依次列舉:
描述性統計:用於描述數據的分布、中心位置、離散程度和對稱性等特徵。常用的描述性統計方法包括均值、中位數、標准差、偏度、峰度等。
假設檢驗:用於檢驗某個假鏈旦設是否成立,例如檢驗兩組數據之間的差異是否顯著。常用的假設檢驗方法包括t檢驗、ANOVA分析、卡方檢驗等。
相關分析:用於分析兩個或多個變數之間的關系。常用的相關分析方法包括皮爾遜相關系數、斯皮爾曼相關系數、卡方檢驗等。
回歸分析:用於研究一個或多個自變數與一個因變數之間的關系。常用的回歸分析方法包括線性回歸、邏輯回歸、多元回歸等。
聚類分析:用於將數據集中的樣本劃分為若干個互不重疊的子集,每個子集內部的樣本相似度較高,不同子集之間的樣本相似度較低。常用的聚類分析方法包括K均值聚類、層次聚類等。
分類分析:用於根據已知樣本的特徵,對未知樣本進行分類。常用的分類分析方法包括決策樹、支持向量機、樸素貝葉斯等。
時間序列分析:用於研究時間序列數據的規律和趨勢,常用於經濟、金融和股市等領域。常用的時間序列分析方法包括ARIMA模型、指數平滑模型、神經網路模型等。
以上是常見的數據分析方法