Ⅰ ppt怎樣做圖表數據分析圖圖文教程
ppt怎麼做圖表數據分析圖呢,新手不會,上網找怕麻煩,而且教程太亂沒有統一的答案怎麼辦,哪裡有更好的方法?下面我馬上就告訴大家ppt做圖表數據分析圖的方法。
1.打開ppt以後先建立一個幻燈片,點擊菜單欄上面的【新建幻燈片】---選擇任意一個布局。
Ⅱ 16種常用的數據分析方法匯總
一、描述統計
描述性統計是指運用製表和分類,圖形以及計筠概括性數據來描述數據的集中趨勢、離散趨勢、偏度、峰度。
1、缺失值填充:常用方法:剔除法、均值法、最小鄰居法、比率回歸法、決策樹法。
2、正態性檢驗:很多統計方法都要求數值服從或近似服從正態分布,所以之前需要進行正態性檢驗。常用方法:非參數檢驗的K-量檢驗、P-P圖、Q-Q圖、W檢驗、動差法。
二、假設檢驗
1、參數檢驗
參數檢驗是在已知總體分布的條件下(一股要求總體服從正態分布)對一些主要的參數(如均值、百分數、方差、相關系數等)進行的檢驗 。
1)U驗 使用條件:當樣本含量n較大時,樣本值符合正態分布
2)T檢驗 使用條件:當樣本含量n較小時,樣本值符合正態分布
A 單樣本t檢驗:推斷該樣本來自的總體均數μ與已知的某一總體均數μ0 (常為理論值或標准值)有無差別;
B 配對樣本t檢驗:當總體均數未知時,且兩個樣本可以配對,同對中的兩者在可能會影響處理效果的各種條件方面扱為相似;
C 兩獨立樣本t檢驗:無法找到在各方面極為相似的兩樣本作配對比較時使用。
2、非參數檢驗
非參數檢驗則不考慮總體分布是否已知,常常也不是針對總體參數,而是針對總體的某些一股性假設(如總體分布的位罝是否相同,總體分布是否正態)進行檢驗。
適用情況:順序類型的數據資料,這類數據的分布形態一般是未知的。
A 雖然是連續數據,但總體分布形態未知或者非正態;
B 體分布雖然正態,數據也是連續類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、遊程檢驗、K-量檢驗等。
三、信度分析
檢査測量的可信度,例如調查問卷的真實性。
分類:
1、外在信度:不同時間測量時量表的一致性程度,常用方法重測信度
2、內在信度;每個量表是否測量到單一的概念,同時組成兩表的內在體項一致性如何,常用方法分半信度。
四、列聯表分析
用於分析離散變數或定型變數之間是否存在相關。
對於二維表,可進行卡方檢驗,對於三維表,可作Mentel-Hanszel分層分析。
列聯表分析還包括配對計數資料的卡方檢驗、行列均為順序變數的相關檢驗。
五、相關分析
研究現象之間是否存在某種依存關系,對具體有依存關系的現象探討相關方向及相關程度。
1、單相關: 兩個因素之間的相關關系叫單相關,即研究時只涉及一個自變數和一個因變數;
2、復相關 :三個或三個以上因素的相關關系叫復相關,即研究時涉及兩個或兩個以上的自變數和因變數相關;
3、偏相關:在某一現象與多種現象相關的場合,當假定其他變數不變時,其中兩個變數之間的相關關系稱為偏相關。
六、方差分析
使用條件:各樣本須是相互獨立的隨機樣本;各樣本來自正態分布總體;各總體方差相等。
分類
1、單因素方差分析:一項試驗只有一個影響因素,或者存在多個影響因素時,只分析一個因素與響應變數的關系
2、多因素有交互方差分析:一頊實驗有多個影響因素,分析多個影響因素與響應變數的關系,同時考慮多個影響因素之間的關系
3、多因素無交互方差分析:分析多個影響因素與響應變數的關系,但是影響因素之間沒有影響關系或忽略影響關系
4、協方差分祈:傳統的方差分析存在明顯的弊端,無法控制分析中存在的某些隨機因素,使之影響了分祈結果的准確度。協方差分析主要是在排除了協變數的影響後再對修正後的主效應進行方差分析,是將線性回歸與方差分析結合起來的一種分析方法,
七、回歸分析
分類:
1、一元線性回歸分析:只有一個自變數X與因變數Y有關,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布。
2、多元線性回歸分析
使用條件:分析多個自變數與因變數Y的關系,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布 。
1)變呈篩選方式:選擇最優回歸方程的變里篩選法包括全橫型法(CP法)、逐步回歸法,向前引入法和向後剔除法
2)橫型診斷方法:
A 殘差檢驗: 觀測值與估計值的差值要艱從正態分布
B 強影響點判斷:尋找方式一般分為標准誤差法、Mahalanobis距離法
C 共線性診斷:
診斷方式:容忍度、方差擴大因子法(又稱膨脹系數VIF)、特徵根判定法、條件指針CI、方差比例
處理方法:增加樣本容量或選取另外的回歸如主成分回歸、嶺回歸等
3、Logistic回歸分析
線性回歸模型要求因變數是連續的正態分布變里,且自變數和因變數呈線性關系,而Logistic回歸模型對因變數的分布沒有要求,一般用於因變數是離散時的情況
分類:
Logistic回歸模型有條件與非條件之分,條件Logistic回歸模型和非條件Logistic回歸模型的區別在於參數的估計是否用到了條件概率。
4、其他回歸方法 非線性回歸、有序回歸、Probit回歸、加權回歸等
八、聚類分析
樣本個體或指標變數按其具有的特性進行分類,尋找合理的度量事物相似性的統計量。
1、性質分類:
Q型聚類分析:對樣本進行分類處理,又稱樣本聚類分祈 使用距離系數作為統計量衡量相似度,如歐式距離、極端距離、絕對距離等
R型聚類分析:對指標進行分類處理,又稱指標聚類分析 使用相似系數作為統計量衡量相似度,相關系數、列聯系數等
2、方法分類:
1)系統聚類法: 適用於小樣本的樣本聚類或指標聚類,一般用系統聚類法來聚類指標,又稱分層聚類
2)逐步聚類法 :適用於大樣本的樣本聚類
3)其他聚類法 :兩步聚類、K均值聚類等
九、判別分析
1、判別分析:根據已掌握的一批分類明確的樣品建立判別函數,使產生錯判的事例最少,進而對給定的一個新樣品,判斷它來自哪個總體
2、與聚類分析區別
1)聚類分析可以對樣本逬行分類,也可以對指標進行分類;而判別分析只能對樣本
2)聚類分析事先不知道事物的類別,也不知道分幾類;而判別分析必須事先知道事物的類別,也知道分幾類
3)聚類分析不需要分類的歷史資料,而直接對樣本進行分類;而判別分析需要分類歷史資料去建立判別函數,然後才能對樣本進行分類
3、進行分類 :
1)Fisher判別分析法 :
以距離為判別准則來分類,即樣本與哪個類的距離最短就分到哪一類, 適用於兩類判別;
以概率為判別准則來分類,即樣本屬於哪一類的概率最大就分到哪一類,適用於
適用於多類判別。
2)BAYES判別分析法 :
BAYES判別分析法比FISHER判別分析法更加完善和先進,它不僅能解決多類判別分析,而且分析時考慮了數據的分布狀態,所以一般較多使用;
十、主成分分析
將彼此梠關的一組指標變適轉化為彼此獨立的一組新的指標變數,並用其中較少的幾個新指標變數就能綜合反應原多個指標變數中所包含的主要信息 。
十一、因子分析
一種旨在尋找隱藏在多變數數據中、無法直接觀察到卻影響或支配可測變數的潛在因子、並估計潛在因子對可測變數的影響程度以及潛在因子之間的相關性的一種多元統計分析方法
與主成分分析比較:
相同:都能夠起到済理多個原始變數內在結構關系的作用
不同:主成分分析重在綜合原始變適的信息.而因子分析重在解釋原始變數間的關系,是比主成分分析更深入的一種多元統計方法
用途:
1)減少分析變數個數
2)通過對變數間相關關系探測,將原始變數進行分類
十二、時間序列分析
動態數據處理的統計方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題;時間序列通常由4種要素組成:趨勢、季節變動、循環波動和不規則波動。
主要方法:移動平均濾波與指數平滑法、ARIMA橫型、量ARIMA橫型、ARIMAX模型、向呈自回歸橫型、ARCH族模型
十三、生存分析
用來研究生存時間的分布規律以及生存時間和相關因索之間關系的一種統計分析方法
1、包含內容:
1)描述生存過程,即研究生存時間的分布規律
2)比較生存過程,即研究兩組或多組生存時間的分布規律,並進行比較
3)分析危險因素,即研究危險因素對生存過程的影響
4)建立數學模型,即將生存時間與相關危險因素的依存關系用一個數學式子表示出來。
2、方法:
1)統計描述:包括求生存時間的分位數、中數生存期、平均數、生存函數的估計、判斷生存時間的圖示法,不對所分析的數據作出任何統計推斷結論
2)非參數檢驗:檢驗分組變數各水平所對應的生存曲線是否一致,對生存時間的分布沒有要求,並且檢驗危險因素對生存時間的影響。
A 乘積極限法(PL法)
B 壽命表法(LT法)
3)半參數橫型回歸分析:在特定的假設之下,建立生存時間隨多個危險因素變化的回歸方程,這種方法的代表是Cox比例風險回歸分析法
4)參數模型回歸分析:已知生存時間服從特定的參數橫型時,擬合相應的參數模型,更准確地分析確定變數之間的變化規律
十四、典型相關分析
相關分析一般分析兩個變里之間的關系,而典型相關分析是分析兩組變里(如3個學術能力指標與5個在校成績表現指標)之間相關性的一種統計分析方法。
典型相關分析的基本思想和主成分分析的基本思想相似,它將一組變數與另一組變數之間單變數的多重線性相關性研究轉化為對少數幾對綜合變數之間的簡單線性相關性的研究,並且這少數幾對變數所包含的線性相關性的信息幾乎覆蓋了原變數組所包含的全部相應信息。
十五、R0C分析
R0C曲線是根據一系列不同的二分類方式(分界值或決定閾).以真陽性率(靈敏度)為縱坐標,假陽性率(1-特異度)為橫坐標繪制的曲線
用途:
1、R0C曲線能很容易地査出任意界限值時的對疾病的識別能力
用途
2、選擇最佳的診斷界限值。R0C曲線越靠近左上角,試驗的准確性就越高;
3、兩種或兩種以上不同診斷試驗對疾病識別能力的比較,一股用R0C曲線下面積反映診斷系統的准確性。
十六、其他分析方法
多重響應分析、距離分祈、項目分祈、對應分祈、決策樹分析、神經網路、系統方程、蒙特卡洛模擬等。
Ⅲ 數據分析->分析方法
1.對比分析:
靜態比較是在同一時間條件下對不同總體指標的比較,如不同部門,不同地區,不同國家的比較,也叫橫向比較,簡稱橫比。
動態比較是在同一總體條件下對不同時期指標數值的比較,也叫縱向比較,簡稱縱比。
實踐:1).與目標對比。
實際完成與目標對比屬於橫比。
如果一年還沒過完,可以拆分成階段,再對比,或者計算完成率
2).不同時期對比
不同時期對比,屬於縱比。
與去年同期對比,簡稱同比(主要考慮季節周期性變化,淡旺季)
與上個月對比,簡稱環比
3).與同級,單位,部門屬於橫比
4).行業內對比屬於橫比,與行業標桿,競爭對手或者行業的平均水平
5).活動效果對比
對某項營銷活動開戰前後進行對比,屬於縱比。可以看出活動是否有效果
還可對企業投放廣告的前後業務狀況進行對比,了解投放廣告是否有效,知名度是否提高,銷 量是否大幅增長。
另外對比對象的計量單位,指標類型等要一致,對象之間相似之處越多,越具有可比性。
最後算出每一行的分數再排序。如果有0的話,就全部結果+1.
某指標權重=(某指標新的重要性合計得分/所有指標新的重要性合計得分)*100%
7.杜邦分析法
8.漏斗圖分析法
瀏覽商品(40%)->放入購物車(75%)->生成訂單(67%)->支付訂單(85%)->完成交易
9.矩陣關聯分析法 也叫象限圖分析法
以屬性A為橫軸,屬性B為縱軸組成一個坐標系,按某一標准(平均值,經驗值等)劃分,將要分析的某個事物投射在四個象限內,進行交叉分析,直觀的將兩個屬性的關聯性展示出來。
先解決主要矛盾,再解決次要矛盾,有利於工作效率。
如果好幾項落在了一個緯度,那麼先執行哪一個就需要再加入一個屬性進行判斷。例如加入改進難度,可以用氣泡表示改進的難易程度,氣泡越大,難度越大。
10.發展矩陣
要了解2008-2010年的發展,距可以將三年的數據畫在同一張矩陣表中,畫上箭頭。
Ⅳ 數據分析必讀干貨:簡單而實用的3大分析方法
導讀:數據分析師需要哪些「專業技能」?如果有人建議你去學習R語言、tableau、PowerBI,那麼我建議你不如先從最基礎也是最核心的數據分析方法學起。
在一家年銷售不到10億的電商公司(行業中大部分電商企業年銷售可能都不到1個億),你只要掌握一些基礎的數據分析方法,再配合Excel表格,就足夠你完成各種數據化運營工作了。
本文主要講解日常數據分析中,最常用的三大數據分析方法 。內容雖然簡單,但是其中充滿了大量的細節方面的實用技巧。
01 對比
對比是所有數據分析方法中最基礎,也是大家耳熟能詳的一個。俗話說,無對比,不分析。說的就是對比分析法了。
在實際分析場景中,對比有不同的應用維度。比如有環比、同比、橫比、縱比、絕對值對比,相對值對比等。下面我們分別解釋一下它們的不同應用場景。
1. 絕對值對比與相對值對比
從概念上而言,絕對值包含正數、負數和零值。在電商數據分析中,一般是指正數之間的對比較多,如銷售額、退貨額等;相對值對比,則是指轉化率、完成率等這類相對數之間的對比。
2. 環比
環比是指統計周期內的數據與上期數據的比較,比如2017年6月數據與2017年5月數據的比較。
在電商數據分析中,由於每個自然月之間的銷售差額比較大,如果採用絕對指標,便很難通過對比觀察到業務的變化。
因此,一般會採用相對指標來做環比分析,如2017年6月的銷售達標率是102%,2017年5月的銷售達標率是96%;這樣便很容易知道兩個月度之間轉化率的好壞優劣了。然而,如果我們用絕對值來對比:2017年6月銷售額500萬,2017年5月銷售額300萬,這樣的對比便很難判斷究竟哪個月的銷售額完成得更好。
3. 同比
同比是指統計周期內數據與去年同期數據之間的對比,比如2017年6月銷售額是500萬,2016年6月銷售額是450萬,同比增加11.1%。
在電商分析中,同比是應用最廣泛的數據分析方法。通過同比,我們能大致判斷店鋪的運營能力在最近一年中,是保持增長還是呈下滑趨勢。
同時,也可以根據同比增長趨勢,來制訂初步的銷售計劃。如表3-4所示,假設現在店鋪流量同比下降8%(流量下降是平台趨勢),客單價保持不變的情況下,要想實現店鋪銷售業績的上升,唯有提升轉化率。
因此,我們通過表3-4的模擬推算,可以得知,當轉化率提升21%,到達0.35%時(0.35%轉化率被認為是行業的平均值),業績會提升11%。
▼表3-4 店鋪銷售計劃推算模擬表
4. 橫向對比與縱向對比
所謂橫向對比與縱向對比,是指空間與時間兩個不同的維度之間的對比。橫向對比是空間維度的對比,指同類型的不同對象在統一的標准下進行的數據對比。如「本店」與「競品」之間的對比;縱向對比是時間維度的對比,指同一對象在不同時間軸上的對比。如前面提到的「同比」「環比」都是縱向對比。
5. 份額
嚴格地說,「份額」屬於橫向對比的一種。由於在實際分析場景中它經常會被忽略,因此單獨羅列出來,加以說明。
在某些情況下,數據表格中多一個「份額」,會讓表格清晰明了許多。
如表3-5所示,假設我們要分析「某品牌天貓、京東、唯品會三大渠道」的「上衣、下衣、連衣裙和其他」在「Q1~Q4季度」的銷售趨勢和表現。常規的分析方法是,按照表1的表格結構,將各種數據有層次地展現出來。這時,所有的銷售數據在表格中可以層次分明地一覽無余。
▼表3-5 以份額處理的數據表格
但是,如表1這般的數據卻不能直觀告訴我們每個銷售類別在不同渠道和不同季度的銷售趨勢是什麼。因此,在數據分析中便需要加入表2這樣的「份額」分析表格。如此,我們便可一目瞭然地掌握每個類別在不同渠道、不同時期的銷售趨勢。因此也就達到了數據分析的目的。
很多數據分析師往往只是完成了「表1」的分析步驟,卻缺少臨門一腳,沒有把「表2」也同步呈現出來。
02 細分
細分,是一種從概念上理解非常容易,但實際應用起來卻很難的分析方法。
細分分析法,常用於為分析對象找到更深層次的問題根源。難點在於我們要理解從哪個角度進行「細分」與「深挖」才能達到分析目的。就好像高中課程中解幾何題一樣,如果找對了「解題思路」,問題就迎刃而解;如果「解題思路」錯了,勞心費力不說,問題還解決不了。
在實際應用中,細分有許多不同的方法,就如同我們在解題時,有各種不同的「解題思路」一樣。有時候,面對同一個問題,兩個不同的解題思路都可以達到解題的目的;但更多時候,只有唯一正確的解題思路才可以正確地解題。所以,在分析之前,選擇正確的『細分』方法便非常重要。
下面,我們就具體來看一下,在細分分析中,有哪些解題思路。
1. 分類分析
就是指對所有需要被分析到的數據單元,按照某種標准打上標簽,再根據標簽進行分類,然後使用匯總或者對比的方法來進行分析。
在服裝行業中,常用於做分類分析的標簽有「類目」「價格帶」「折扣帶」「年份」「季節」等。
通過從「年份」「季節」的維度來對商品庫存進行細分,我們可以輕松地知道有多少貨屬於「庫存」,有多少貨屬於「適銷品」;
通過從「折扣帶」的維度來對銷售流水進行細分,我們可以大致知道店鋪的盈利情況;
通過從「類目」的維度對銷售流水和庫存同時進行細分,我們可以知道統計周期內品類的銷售動態與庫存滿足度。
2. 人—貨—場
「人—貨—場」能夠為人提供宏觀視野的分析。其原理類似於分類分析,即將所有需要被分析到的數據單元,打上「人」「貨」「場」的標簽,然後再進行相應的數據分析與處理。
在實際應用場景中,「人—貨—場」分析法往往被靈活運用在初步診斷某一競品店鋪時。
如圖3-3所示是利用「人—貨—場」邏輯方法來分析競品店鋪的主流思路。在分析之前,先把「解題思路」用「人—貨—場」的方式羅列出來,把所有能夠想到的有用的「分支」都羅列出來,然後查漏補缺、標注重要與非重要。最後,再按此「解題思路」來進行分析。便可達到事半功倍的分析效果。
▲圖3-3 利用「人—貨—場」細分方法初步分析競品店鋪
3. 杜邦分析法
細分分析方法中,還有一種知名的分析方法,叫「杜邦分析法」。在電商數據分析中,杜邦分析也是常被使用的分析方法之一。
網路中對杜邦分析的解釋是:「杜邦分析法(DuPont Analysis)是利用幾種主要財務比率之間的關系來綜合分析企業的財務狀況。具體來說,它是一種用來評價公司盈利能力和股東權益回報水平,從財務角度評價企業績效的一種經典方法。」由此可見,杜邦分析主要是用於企業的財務分析之中。
但是在電商中,杜邦分析常被用於尋找銷售變化的細小因素之中。如圖3-4所示,便是根據杜邦分析原理,將所有影響到銷售額的量化指標都統計出來的一種常用分析方法。此種方法,有助於我們從細小的數據顆粒中找到影響銷售變化的元素。
▲圖3-4 銷售變化的原因分析
03 轉化
轉化分析是電商、游戲等互聯網行業的特定分析方法,在傳統行業的零售分析中並不常見。轉化分析常用於頁面跳轉分析、用戶流失分析等業務場景。
轉化分析的表現形式一般是選用漏斗模型,如圖3-5所示,便是模擬了某電商店鋪的流量轉化情況,並以漏斗圖的形式展現出來。
▲圖3-5 電商常見的流量轉化漏斗圖
這張圖模擬了從店鋪的瀏覽商品人數到加購人數,然後生成訂單、支付訂單,直到最後支付成功的漏斗示意圖。
從圖3-5的示例中,反推「轉化」分析方法,我們應該得到以下結論:
轉化分析方法的前提,是我們需要首先確定一條「轉化路徑」(如圖3-5左側的路徑所示),這條路徑就是我們的「解題方法」,是決定我們接下來的分析能否達成目標的重要因素。
當「轉化路徑」確定後,我們需要把「路徑」中的各個「節點」羅列出來,並把節點下的重要數據統計出來。
最後,根據路徑把各節點的數據用漏斗圖的形式表達出來。
同時,轉化分析還可用於店鋪微觀方面的「轉化」洞察。譬如在某一次店鋪舉行大促活動時,我們需要分析大促期間「活動二級頁」的流量轉化效果如何。此時,我們便可以參照如圖3-6所示的漏斗模型。
▲圖3-6 活動頁效果分析的漏斗圖
在以上案例中,我們將轉化路徑定義為「活動頁→詳情頁→支付頁面(下單)→支付成功(購買)」四個節點。然後統計每個頁面的流量到達數量,於是得出如圖3-6所示的漏斗圖。
通過此圖,可以清晰明確地診斷出此次活動二級頁在「下單→付款」環節轉化率僅40%,存在一定問題。在支付界面的流量跳失,很可能是價格過高所致。
本文摘編自《電商數據分析與數據化運營》,經出版方授權發布。
Ⅳ 數據分析的方法有哪些
數據分析的方法有:對比分析法,分組分析法,預測分析法,漏斗分析法,AB測試分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假設性分析法。
1.對比分析法:對比分析法指通過指標的對比來反映事物數量上的變化,屬於統計分析中常用的方法。常見的對比有橫向對比和縱向對比。
橫向對比指的是不同事物在固定時間上的對比,例如,不同等級的用戶在同一時間購買商品的價格對比,不同商品在同一時間的銷量、利潤率等的對比。
數據分析方法是數據統計學當中應用非常廣泛的方法,具體方法有很多種,具體採用的時候因人而異。
Ⅵ 數據分析的幾種常用方法21-10-27
幾種常見的數據分析分析方法:
1.周期性分析(基礎分析)
What :主要是從日常雜亂的數據中,發現周期性出現的現象,而從避免或改善問題的發生。常見的兩種周期:自然周期和生命周期。
需要注意的點:雖然周期性分析主要針對時間序列,但不全是,例如公眾號的文章閱讀走勢不僅和日期(工作日或周末)相關,也和文章類型相關。
例如:銷售中3,6,9,12月,由於績效考核出現的峰值
重點節假日對和交付的影響
產品銷售的季節性影響(例如北方下半年的採暖產品,入夏空調的銷售旺季等)
How: 自然後期的時間維度,根據分析的需求,可從年(同環比,業績達成、和行業趨勢對比),月(淡旺季、銷售進度、生產預測),周(一般較少),日(工作日,非工作日的差異分析),時(時間分布,工作時段,上下班高峰,晚上,主要和大眾消費行為分析相關)進行展開
生命周期一種常見的分析就「商品生命周期」,商品銷量隨上市時間的變化,通過時間軸+指標走勢組合出來的。這種分析對快消品或者產品迭代速度很快的商品(典型如手機)是比較重要的,可以用於監控產品的市場表現,對照市場活動可以量化活動效果以及產品線的經營情況,如持續跟進,則可針對性的提出產品上市的建議。
2.矩陣分析(重要分析方法)
矩陣分析是數據分析中非常重要的分析方法。主要解決分析領域的一個非常致命的核心問題:「到底指標是多少,才算好」。
平均數是一個非常常用的數據維度,但是單一維度,並不能充分評價好壞。例如考核銷售,如果只考核業務銷售業績,那麼業務人員一定會傾向賣利潤低的引流產品。那種利潤高,價格高,不容易賣的利潤型產品就沒人賣了,最後銷售越多,公司的利潤反而下降了。這個時候通過兩個維度:銷售規模和銷售利潤,構建交叉矩陣,就能將業務業績進行更有效的區分。
舉個簡單的例子,一個銷售團隊,10名銷售一個月內開發的客戶數量,產生的總業績用矩陣分析法進行分析(具體數據略):
第一步:先對客戶數量、業績求平均值
第二步:利用平均值,對每個銷售人員的客戶數量、業績進行分類
第三步:區分出多客戶+高業績,少客戶+高業績,多客戶+低業績,少客戶+低業績四類
矩陣分析把關鍵業務目標拆分為兩個維度,每個維度進行高低分類,進而可以對目標進行更加立體的描述。維度高低分類多採用 平均值作為參考 值。
注意:有兩個場景,是不適合用矩陣分析法:
一:有極大/極小值影響了平均值的時候,一般出現極大/極小值的時候,可以用: 分層分析法 。
二:兩個指標高度相關的時候,例如用戶消費金額與消費頻次,兩個指標天生高度相關,此時數據分布會集中在某一個或兩個區域,矩陣分析法的業務解讀能力接近0,可採用 相關分析法
3.結構分析
What: 結構分析是將分析的目標,向下分解,主要用於發現問題。
例如銷售分析,可以按照區域—省—市 一級級的分解,分解之後可以更好的看出影響銷售業績的影響因素在哪個位置。
結構分析可以有多個維度,取決於我們需要分析的方向。例如還是銷售分析,可以從產品構成進行拆解,也可用從業務形態拆解
How:如何進行結構分析?
第一步:定出要分析的關鍵指標(一般是業績、用戶量、DAU、利潤等等)
第二步:了解關鍵指標的構成方式(比如業績,由哪些用戶、哪些商品、哪些渠道組成)
第三步:跟蹤關鍵指標的走勢,了解指標結構變化情況
第四步:在關鍵指標出現明顯上升/下降的時候,找到變化最大的結構分類,分析問題
注意:結構分析的不足
結構分析法是一種:知其然,不知其所以然的方法。只適用於發現問題,不能解答問題
4.分層分析
What: 分層分析,是為了應對 平均值失效 的場景。典型的平均值失效例如平均工資,很多人都被「代表」。這個時候需要把收入群體分成幾類,例如土豪,普通百姓,窮光蛋等,後面進行分析時就比較清楚了。業內也有一些不同的叫法,比如應用於商品的,叫ABC分類,應用於用戶的,叫用戶分層,應用於業務的,叫二八法則。本質都是一回事。
How:如何進行分層分析
1.明確分層對象和分層指標
例如:想區分用戶消費力,分層對象就是:用戶,分層指標就是:消費金額
想區分商品銷售額,分層對象就是:商品,分層指標就是:銷售金額
想區分部銷售額,分層對象就是:分部,分層指標就是:銷售收入
2.查看數據,確認是否需要分層。分層是應對平均值失效的情況的,存在極值影響的情況,則適合分層。
3.設定分層的層級。最好的解決辦法是老闆拍板,其次可以用「二八原則」,以上述銷售業績分層為例,可以先從高到低排序,然後把累積業績佔80%的人選出來,作為「第1層級(優等)」,其他的歸為「第2層級(次等)」。有時如果顆粒度不夠,也可以用「二四六八十」法則」。
如何應用分層
分層的最大作用是幫我們看清楚:到底誰是主力 ,誰是吊車尾。從而指導業務,從人海戰術向精兵簡政思考。
根據分層的結果找出差距,進而提出(假設)差異背後可能的原因,通過其它方式進行
應用 :客戶分析,目前系統中客戶超5000個,為了更好的了解客戶結構,可以通過分層分析的方法對這5000個客戶進行分層,分層的方式通過年銷售規模,可以按照累計規模排序,一般採用4-6個層級,每個層級可以給一個標簽。例如王者客戶,腰部客戶,mini客戶等。分層後,便可以針對性的進行分析,例如客戶層級的銷售佔比,變動,各層級客戶的銷售構成,結合其它方法就可以有較全面的分析
5.漏斗分析(待補充)
6.指標拆解(待補充)
7.相關性分析(待補充)
What :兩個(或多個)因素之間的關系。例如員工人數與銷售額,市場推廣與銷售業績,天氣和銷售表現等
很多因素我們直觀的感覺到之間有聯系,相互影響,但具體的關系是什麼,如何產品影響的,可以通相關性分析來量化。
例如,客戶開拓中拜訪客戶的次數和客戶成交是否有關系?
拜訪次數多,表明客戶也感興趣,所以成功幾率大
拜訪這么多,客戶還不成交,成功幾率不大
客戶成交和拜訪關系不太大,主要看你是否能打動他
How :兩種聯系:直接關系,間接關系
直接關系 :整體指標與部分指標的關系——結構分析,例如銷售業績與各中心的業績
主指標與子指標的關系——拆解分析,例如總銷售規模和客戶數量與客戶銷售規模
前後步驟間的關系——漏斗分析:例如銷售目標和項目覆蓋率,儲備率,簽約等因素間的關系
聯系中,指標之間出現一致性的變化,基本是正常,如果出現相反的變動,則需要關注,這可能是問題所在
間接關系 :要素之間沒有直接的聯系,但存在邏輯上的連接。例如推廣多了,知名度上市,進而銷售額上升。
由於關系非顯性,需要通過處理進行評價,常用的就是散點圖和excel中的相關系數法
在明確相關性後,就可以通過改變其中一個變數來影響和控制另一個變數的發展。
注意:相關性分析也存在很大的局限。主要體現在相關性並不等同因果性。例如十年前你在院子里種了一顆樹,你發現樹每天的高度和中國近十年GDP的增速高度相關,然後這兩者間並沒有什麼實質性的聯系。此次相關性分析過程中一定注意要找到關聯的邏輯自洽。
8.標簽分析(待補充)
9.
Ⅶ 16種常用的數據分析方法-方差分析
方差分析(Analysis ofVariance,簡稱ANOVA),又稱「變異數分析」,又叫F檢驗。是R.A.Fisher發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。
方差波動來源
由於各種因素的影響,研究所得的數據呈現波動狀,而方差分析的基本原理認為不同處理組的均數間的差別基本來源有兩個:一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。
用變數在各組的均值與總均值之偏差平方和的總和表示,記作SSb,組間自由度dfb。
用變數在各組的均值與該組內變數值之偏差平方和的總和表示,記作SSw,組內自由度dfw。
總偏差平方和 SSt = SSb +SSw。
方差分析應用場景
方差分析在工作場景中如何應用呢?看案例:
假如產品針對用戶提出了三種提高客單價的策略A、B、C,現在要評估3種策略對提高客單價的效果差異。
如何知道3種策略效果有什麼不同?最簡單的方法就是做一個實驗。
如:隨機挑選一部分用戶,然後把這些用戶分成三組A、B、C組,A組用戶使用A策略、B組用戶使用B策略、C組用戶使用C策略,
策略實施一段時間以後,分析3組分別的客單價水平。哪組平均客單價高,就說明哪組策略有效。
可是,這樣得出的結論是否有偏差呢?
當然有,出現偏差的來源:
其一是實驗的用戶是隨機挑選的,有可能客單價高的那部分用戶(如高價值用戶)集中出現在某一組中,造成這組的策略效果更好。
當然,按照方差原理的差別基本來源,還有可能由於策略執行過程中,實驗條件造成的策略結果差異。
為了排除實驗結果中,上述兩種來源造成的結果偏差,就需要使用方差分析去證做進一步證實。最終獲得更嚴謹、更有說服力的策略結論。
方差分析中的名詞解釋
方差:又叫均方,是標准差的平方,是表示變異的量。
因素:方差分析的研究變數;例如,研究裁判打分的差異,裁判就被稱為因素;
水平:因素中的內容稱為水平;例如,總共有3個裁判打分,則裁判因素的水平就是3;
觀測因素:又稱觀測變數,指對影響總體的因素;
控制因素:又稱控制變數,指影響觀測變數的因素;
方差分析的3 個假定基礎
1.每組樣本數據對應的總體應該服從正態分布;
正態檢驗主要有兩種大的方法,一種是統計檢驗的方法:主要有基於峰度和偏度的SW檢驗、基於擬合度的KS、CVM、AD檢驗;另一種是用描述的方法:Q-Q圖和P-P圖、莖葉圖,利用四分位數間距和標准差來判斷。
2.每組樣本數據對應的總體方差要相等,方差相等又叫方差齊性;
方差齊性的主要判斷方法有:方差比、Hartley檢驗、Levene檢驗、BF法。
3.每組之間的值是相互獨立的,就是A、B、C組的值不會相互影響。
單因素方差分析-F 檢驗
方差分析把總的變異分為組間變異和組內變異:
組間變異:各組的均數與總均數間的差異;
組內變異:每組的每個測量值與該組均數的差異
離差平方和為:SS總=SS組間+SS組內
F統計量可表述為:F=MS組間/MS組內。
F值結論理解:通過計算得到的F值就可以查到P值,P值小於0.05,則拒絕原假設,認為其是有統計學意義的。
案例:
某飲料生產企業研製出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無色透明。
這四種飲料的營養含量、味道、價格、包裝等可能影響銷售量的因素全部相同,先從地理位置相似、經營規模相仿的五家超級市場上收集了前一期該種飲料的銷售量情況
表中20個數據各不相同,原因可能有兩個方面:
一、銷售地點影響。相同顏色的飲料在不同超市的銷售量不同。案例中五個超市地理位置相似、經營規模相仿,因此把不同地點的銷售量差異做為隨機因素影響。
二、飲料顏色不同的影響。在同一超市不同顏色的飲料銷售量不同。即使營養成分、味道、價格、包裝等方面因素都相同,銷售量也不相同。
這種不同雖然有類似抽樣隨機性造成,但更可能是人們對不同顏色的偏愛造成的。
根據上述分析,把案例分析問題歸結為:檢驗飲料顏色對銷售量是否有影響。
分析過程
一、建立假設:原假設「顏色對銷售量沒有影響」
二、計算不同顏色飲料銷售量水平均值
無色飲料銷售量均值=136.6÷5=27.32箱
粉色飲料銷售量均值=147.8÷5=29.56箱
桔黃色飲料銷售量均值=132.2÷5=26.44箱
綠色飲料銷售量均值=157.3÷5=31.46箱
三、計算各種顏色飲料銷售量的總均值
各種顏色飲料銷售量總的樣本平均數=(136.6+147.8+132.2+157.3)÷20=28.695箱
四、計算離差平方和、F值
F值=組間方差/組內方差=76.8455/(4-1)/ 39.0840/(20-4)=10.486
五、算出P值,做出結論
P值=根據F值算出P值=0.000466
結論解讀:
P-值=0.000466<顯著水平標准=0.05,假設不成立,說明飲料的顏色對銷售量有顯著影響。
Ⅷ 數據分析的方法有哪些
數據分析是指通過統計分析方法對收集到的數據進行分析,將數據加以匯總、理解並消化,通過數據分析可以幫助人們作出判斷,根據分析結果採取恰當的對策,常用的數據分析方法如下:
將收集到的數據通過加工、整理和分析的過程,使其轉化為信息,通常來說,數據分析常用的方法有列表法和作圖法,所謂列表法,就是將數據按一定規律用列表方式表達出來,是記錄和處理數據最常用的一種方法;
表格設計應清楚表明對應關系,簡潔明了,有利於發現要相關量之間的關系,並且在標題欄中還要註明各個量的名稱、符號、數量級和單位等;
而作圖法則能夠醒目地表達各個物理量間的變化關系,從圖線上可以簡便求出實驗需要的某些結果,一些復雜的函數關系也可以通過一定的變化用圖形來表現。
想要了解更多關於數據分析的問題,可以咨詢一下CDA認證中心。CDA行業標准由國際范圍數據領域的行業專家、學者及知名企業共同制定並每年修訂更新,確保了標準的公立性、權威性、前沿性。通過CDA認證考試者可獲得CDA中英文認證證書。
Ⅸ 數據分析的基本方法有哪些
數據分析的三個常用方法:
1. 數據趨勢分析
趨勢分析一般而言,適用於產品核心指標的長期跟蹤,比如,點擊率,GMV,活躍用戶數等。做出簡單的數據趨勢圖,並不算是趨勢分析,趨勢分析更多的是需要明確數據的變化,以及對變化原因進行分析。
趨勢分析,最好的產出是比值。在趨勢分析的時候需要明確幾個概念:環比,同比,定基比。環比是指,是本期統計數據與上期比較,例如2019年2月份與2019年1月份相比較,環比可以知道最近的變化趨勢,但是會有些季節性差異。為了消除季節差異,於是有了同比的概念,例如2019年2月份和2018年2月份進行比較。定基比更好理解,就是和某個基點進行比較,比如2018年1月作為基點,定基比則為2019年2月和2018年1月進行比較。
比如:2019年2月份某APP月活躍用戶數我2000萬,相比1月份,環比增加2%,相比去年2月份,同比增長20%。趨勢分析另一個核心目的則是對趨勢做出解釋,對於趨勢線中明顯的拐點,發生了什麼事情要給出合理的解釋,無論是外部原因還是內部原因。
2. 數據對比分析
數據的趨勢變化獨立的看,其實很多情況下並不能說明問題,比如如果一個企業盈利增長10%,我們並無法判斷這個企業的好壞,如果這個企業所處行業的其他企業普遍為負增長,則5%很多,如果行業其他企業增長平均為50%,則這是一個很差的數據。
對比分析,就是給孤立的數據一個合理的參考系,否則孤立的數據毫無意義。在此我向大家推薦一個大數據技術交流圈: 658558542 突破技術瓶頸,提升思維能力 。
一般而言,對比的數據是數據的基本面,比如行業的情況,全站的情況等。有的時候,在產品迭代測試的時候,為了增加說服力,會人為的設置對比的基準。也就是A/B test。
比較試驗最關鍵的是A/B兩組只保持單一變數,其他條件保持一致。比如測試首頁改版的效果,就需要保持A/B兩組用戶質量保持相同,上線時間保持相同,來源渠道相同等。只有這樣才能得到比較有說服力的數據。
3. 數據細分分析
在得到一些初步結論的時候,需要進一步地細拆,因為在一些綜合指標的使用過程中,會抹殺一些關鍵的數據細節,而指標本身的變化,也需要分析變化產生的原因。這里的細分一定要進行多維度的細拆。常見的拆分方法包括:
分時 :不同時間短數據是否有變化。
分渠道 :不同來源的流量或者產品是否有變化。
分用戶 :新注冊用戶和老用戶相比是否有差異,高等級用戶和低等級用戶相比是否有差異。
分地區 :不同地區的數據是否有變化。
組成拆分 :比如搜索由搜索片語成,可以拆分不同搜索詞;店鋪流量由不用店鋪產生,可以分拆不同的店鋪。
細分分析是一個非常重要的手段,多問一些為什麼,才是得到結論的關鍵,而一步一步拆分,就是在不斷問為什麼的過程。