1. 16種常用的數據分析方法匯總
一、描述統計
描述性統計是指運用製表和分類,圖形以及計筠概括性數據來描述數據的集中趨勢、離散趨勢、偏度、峰度。
1、缺失值填充:常用方法:剔除法、均值法、最小鄰居法、比率回歸法、決策樹法。
2、正態性檢驗:很多統計方法都要求數值服從或近似服從正態分布,所以之前需要進行正態性檢驗。常用方法:非參數檢驗的K-量檢驗、P-P圖、Q-Q圖、W檢驗、動差法。
二、假設檢驗
1、參數檢驗
參數檢驗是在已知總體分布的條件下(一股要求總體服從正態分布)對一些主要的參數(如均值、百分數、方差、相關系數等)進行的檢驗 。
1)U驗 使用條件:當樣本含量n較大時,樣本值符合正態分布
2)T檢驗 使用條件:當樣本含量n較小時,樣本值符合正態分布
A 單樣本t檢驗:推斷該樣本來自的總體均數μ與已知的某一總體均數μ0 (常為理論值或標准值)有無差別;
B 配對樣本t檢驗:當總體均數未知時,且兩個樣本可以配對,同對中的兩者在可能會影響處理效果的各種條件方面扱為相似;
C 兩獨立樣本t檢驗:無法找到在各方面極為相似的兩樣本作配對比較時使用。
2、非參數檢驗
非參數檢驗則不考慮總體分布是否已知,常常也不是針對總體參數,而是針對總體的某些一股性假設(如總體分布的位罝是否相同,總體分布是否正態)進行檢驗。
適用情況:順序類型的數據資料,這類數據的分布形態一般是未知的。
A 雖然是連續數據,但總體分布形態未知或者非正態;
B 體分布雖然正態,數據也是連續類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、遊程檢驗、K-量檢驗等。
三、信度分析
檢査測量的可信度,例如調查問卷的真實性。
分類:
1、外在信度:不同時間測量時量表的一致性程度,常用方法重測信度
2、內在信度;每個量表是否測量到單一的概念,同時組成兩表的內在體項一致性如何,常用方法分半信度。
四、列聯表分析
用於分析離散變數或定型變數之間是否存在相關。
對於二維表,可進行卡方檢驗,對於三維表,可作Mentel-Hanszel分層分析。
列聯表分析還包括配對計數資料的卡方檢驗、行列均為順序變數的相關檢驗。
五、相關分析
研究現象之間是否存在某種依存關系,對具體有依存關系的現象探討相關方向及相關程度。
1、單相關: 兩個因素之間的相關關系叫單相關,即研究時只涉及一個自變數和一個因變數;
2、復相關 :三個或三個以上因素的相關關系叫復相關,即研究時涉及兩個或兩個以上的自變數和因變數相關;
3、偏相關:在某一現象與多種現象相關的場合,當假定其他變數不變時,其中兩個變數之間的相關關系稱為偏相關。
六、方差分析
使用條件:各樣本須是相互獨立的隨機樣本;各樣本來自正態分布總體;各總體方差相等。
分類
1、單因素方差分析:一項試驗只有一個影響因素,或者存在多個影響因素時,只分析一個因素與響應變數的關系
2、多因素有交互方差分析:一頊實驗有多個影響因素,分析多個影響因素與響應變數的關系,同時考慮多個影響因素之間的關系
3、多因素無交互方差分析:分析多個影響因素與響應變數的關系,但是影響因素之間沒有影響關系或忽略影響關系
4、協方差分祈:傳統的方差分析存在明顯的弊端,無法控制分析中存在的某些隨機因素,使之影響了分祈結果的准確度。協方差分析主要是在排除了協變數的影響後再對修正後的主效應進行方差分析,是將線性回歸與方差分析結合起來的一種分析方法,
七、回歸分析
分類:
1、一元線性回歸分析:只有一個自變數X與因變數Y有關,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布。
2、多元線性回歸分析
使用條件:分析多個自變數與因變數Y的關系,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布 。
1)變呈篩選方式:選擇最優回歸方程的變里篩選法包括全橫型法(CP法)、逐步回歸法,向前引入法和向後剔除法
2)橫型診斷方法:
A 殘差檢驗: 觀測值與估計值的差值要艱從正態分布
B 強影響點判斷:尋找方式一般分為標准誤差法、Mahalanobis距離法
C 共線性診斷:
診斷方式:容忍度、方差擴大因子法(又稱膨脹系數VIF)、特徵根判定法、條件指針CI、方差比例
處理方法:增加樣本容量或選取另外的回歸如主成分回歸、嶺回歸等
3、Logistic回歸分析
線性回歸模型要求因變數是連續的正態分布變里,且自變數和因變數呈線性關系,而Logistic回歸模型對因變數的分布沒有要求,一般用於因變數是離散時的情況
分類:
Logistic回歸模型有條件與非條件之分,條件Logistic回歸模型和非條件Logistic回歸模型的區別在於參數的估計是否用到了條件概率。
4、其他回歸方法 非線性回歸、有序回歸、Probit回歸、加權回歸等
八、聚類分析
樣本個體或指標變數按其具有的特性進行分類,尋找合理的度量事物相似性的統計量。
1、性質分類:
Q型聚類分析:對樣本進行分類處理,又稱樣本聚類分祈 使用距離系數作為統計量衡量相似度,如歐式距離、極端距離、絕對距離等
R型聚類分析:對指標進行分類處理,又稱指標聚類分析 使用相似系數作為統計量衡量相似度,相關系數、列聯系數等
2、方法分類:
1)系統聚類法: 適用於小樣本的樣本聚類或指標聚類,一般用系統聚類法來聚類指標,又稱分層聚類
2)逐步聚類法 :適用於大樣本的樣本聚類
3)其他聚類法 :兩步聚類、K均值聚類等
九、判別分析
1、判別分析:根據已掌握的一批分類明確的樣品建立判別函數,使產生錯判的事例最少,進而對給定的一個新樣品,判斷它來自哪個總體
2、與聚類分析區別
1)聚類分析可以對樣本逬行分類,也可以對指標進行分類;而判別分析只能對樣本
2)聚類分析事先不知道事物的類別,也不知道分幾類;而判別分析必須事先知道事物的類別,也知道分幾類
3)聚類分析不需要分類的歷史資料,而直接對樣本進行分類;而判別分析需要分類歷史資料去建立判別函數,然後才能對樣本進行分類
3、進行分類 :
1)Fisher判別分析法 :
以距離為判別准則來分類,即樣本與哪個類的距離最短就分到哪一類, 適用於兩類判別;
以概率為判別准則來分類,即樣本屬於哪一類的概率最大就分到哪一類,適用於
適用於多類判別。
2)BAYES判別分析法 :
BAYES判別分析法比FISHER判別分析法更加完善和先進,它不僅能解決多類判別分析,而且分析時考慮了數據的分布狀態,所以一般較多使用;
十、主成分分析
將彼此梠關的一組指標變適轉化為彼此獨立的一組新的指標變數,並用其中較少的幾個新指標變數就能綜合反應原多個指標變數中所包含的主要信息 。
十一、因子分析
一種旨在尋找隱藏在多變數數據中、無法直接觀察到卻影響或支配可測變數的潛在因子、並估計潛在因子對可測變數的影響程度以及潛在因子之間的相關性的一種多元統計分析方法
與主成分分析比較:
相同:都能夠起到済理多個原始變數內在結構關系的作用
不同:主成分分析重在綜合原始變適的信息.而因子分析重在解釋原始變數間的關系,是比主成分分析更深入的一種多元統計方法
用途:
1)減少分析變數個數
2)通過對變數間相關關系探測,將原始變數進行分類
十二、時間序列分析
動態數據處理的統計方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題;時間序列通常由4種要素組成:趨勢、季節變動、循環波動和不規則波動。
主要方法:移動平均濾波與指數平滑法、ARIMA橫型、量ARIMA橫型、ARIMAX模型、向呈自回歸橫型、ARCH族模型
十三、生存分析
用來研究生存時間的分布規律以及生存時間和相關因索之間關系的一種統計分析方法
1、包含內容:
1)描述生存過程,即研究生存時間的分布規律
2)比較生存過程,即研究兩組或多組生存時間的分布規律,並進行比較
3)分析危險因素,即研究危險因素對生存過程的影響
4)建立數學模型,即將生存時間與相關危險因素的依存關系用一個數學式子表示出來。
2、方法:
1)統計描述:包括求生存時間的分位數、中數生存期、平均數、生存函數的估計、判斷生存時間的圖示法,不對所分析的數據作出任何統計推斷結論
2)非參數檢驗:檢驗分組變數各水平所對應的生存曲線是否一致,對生存時間的分布沒有要求,並且檢驗危險因素對生存時間的影響。
A 乘積極限法(PL法)
B 壽命表法(LT法)
3)半參數橫型回歸分析:在特定的假設之下,建立生存時間隨多個危險因素變化的回歸方程,這種方法的代表是Cox比例風險回歸分析法
4)參數模型回歸分析:已知生存時間服從特定的參數橫型時,擬合相應的參數模型,更准確地分析確定變數之間的變化規律
十四、典型相關分析
相關分析一般分析兩個變里之間的關系,而典型相關分析是分析兩組變里(如3個學術能力指標與5個在校成績表現指標)之間相關性的一種統計分析方法。
典型相關分析的基本思想和主成分分析的基本思想相似,它將一組變數與另一組變數之間單變數的多重線性相關性研究轉化為對少數幾對綜合變數之間的簡單線性相關性的研究,並且這少數幾對變數所包含的線性相關性的信息幾乎覆蓋了原變數組所包含的全部相應信息。
十五、R0C分析
R0C曲線是根據一系列不同的二分類方式(分界值或決定閾).以真陽性率(靈敏度)為縱坐標,假陽性率(1-特異度)為橫坐標繪制的曲線
用途:
1、R0C曲線能很容易地査出任意界限值時的對疾病的識別能力
用途
2、選擇最佳的診斷界限值。R0C曲線越靠近左上角,試驗的准確性就越高;
3、兩種或兩種以上不同診斷試驗對疾病識別能力的比較,一股用R0C曲線下面積反映診斷系統的准確性。
十六、其他分析方法
多重響應分析、距離分祈、項目分祈、對應分祈、決策樹分析、神經網路、系統方程、蒙特卡洛模擬等。
2. 數據分析有哪些分析方法
數據分析方法有很多。
常見的有:1、描述統計。2、假設檢驗。3、信度分析。4、列聯表分析。5、相關分析。6、方差分析。7、回歸分析。8、聚類分析。9、判別分析等。
還包括多重響應分析、舉例分析、項目分析、對應分析、決策樹分析、順境網路、系統方程、蒙特卡洛模擬等等。
3. 數據分析的方法有哪些
數據分析的方法有:對比分析法,分組分析法,預測分析法,漏斗分析法,AB測試分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假設性分析法。
1.對比分析法:對比分析法指通過指標的對比來反映事物數量上的變化,屬於統計分析中常用的方法。常見的對比有橫向對比和縱向對比。
橫向對比指的是不同事物在固定時間上的對比,例如,不同等級的用戶在同一時間購買商品的價格對比,不同商品在同一時間的銷量、利潤率等的對比。
數據分析方法是數據統計學當中應用非常廣泛的方法,具體方法有很多種,具體採用的時候因人而異。
4. 數據分析的常用方法數據分析的常用方法有哪些
1、對比分析法:常用於對縱向的、橫向的、最為突出的、計劃與實際的等各種相關數據的。例如:今年與去年同期工資收入的增長情況、3月CPI環比增長情況等。
2、趨勢分析法:常用於在一段時間周期內,通過分析數據運行的變化趨勢(上升或下降),為未來的發展方向提供幫助。例如:用電量的季節性波動、股市的漲跌趨勢等。
3、相關分析法:常用於分析兩個或多個變數之間的性質以及相關程度。例如:氣溫與用電量的相關性、運動量大小與體重的相關性等。
4、回歸分析法:常用於分析一個或多個自變數的變化對一個特定因變數的影響程度,從而確定其關系。例如:氣溫、用電設備、用電時長等因素對用電量數值大小的影響程度、工資收入的高低對生活消費支出大小的影響程度等。
5、描述性分析法:常用於對一組數據樣本的各種特徵進行分析,以便於描述樣本的各種及其所代表的總體的特徵。例如:本月日平均用電量、上海市工資收入中位數等。
6、結構分析法:常用於分析數據總體的內部特徵、性質和變化規律等。例如:各部分用電量占總用電的比重、生活消費支出構成情況等。
5. 數據分析方法一般分為哪三種
1、漏斗分析
漏斗分析是指通過數據分析找到有問題的業務環節,並對其優化。
漏斗分析兩大作用:其一,漏斗分析可以對各個業務階段的用戶、流量的變化進行監控,及時分析低轉化率的環節,找出流失的關鍵,並不斷優化。其二,漏斗分析可以根據不同的人群、渠道,進行差異化的分析,比如新渠道、新客戶,分析出最佳的和最差的,這樣能夠提高操作的准確性和效率。
3、對比分析法
對比分析法即對比數據,分析差別,可以直觀地看到某個方面的變化或差距,並能准確量化地表示這些變化或差距。對比分析既可以基於時間進行對比,也可以基於分類,如部門、地區、類別等進行對比。在工作中,我們會使用對比分析法比較多,比如,如上年的銷量對比、目標與實際對比等。我們在對比的過程中要注意要找相似的對比對象。比如,佛山的人口與上海的人口對比就沒有可比性,是毫無意義的。
6. 三種數據分析方法
首先,常見的數據分析方法有9種: 對比分析,多維度拆解分析,漏斗觀察 ,分布分析,用戶留存分析,用戶畫像,歸因查找,路徑挖掘,行為序列分析。
這里將重點展開分享前三種數據分析方法: 對比分析,多維度拆解分析,漏斗觀察。
1、對比分析
對比分析是 最基礎最常見 的數據分析方法,能 直觀的看出事物某階段的變化,並且可以准確、量化地表達出這種變化/差距是多少 ,重點從「比什麼」「怎麼比」「跟誰比」三個維度進行分析。
(1)比什麼
比什麼,分為絕對值(#)和比例值(%)的比較。
絕對值本身已是具備「價值」的數據,比如銷售金額2000元,閱讀數10000萬,單看數字不易得知問題的嚴重程度;
比例值只有在具體環境中看比例才具備對比價值 ,比如活躍佔比,注冊轉化率, 單看比例值容易受到極端值的影響。
(2)怎麼比
怎麼比,分為環比和同比。
常見的環比有日環比,月環比 ,是指 與當前時間范圍相鄰的上一個時間范圍對比 ,主要用於對短期內具備連續性的數據進行分析,如指標設定;
常見的同比有周同比,年同比 ,是指 與當前時間范圍上層時間范圍的前一范圍中同樣位置進行數據對比分析 ,主要用於觀察更長期的數據集,消除短期數據的干擾。
(3)和誰比
和誰比,分為和自己比、和行業比。
和自己比 ,可以從不同的時間維度,不同的業務線,過往經驗估計,跟自己比較;
和行業比 ,可以觀察分析得出是自身因素,還是行業趨勢,比如都跌的時候,能否比同行跌的少?都漲的時候,能都比同行漲的快?
現在回到上面這條「飛豬公關數據」「放假消息公布以後,10點到12點,國內機票的預定量,比上周同時段增長超過50%;國際機票的增長更加驚人,超過了150%。」
很顯然,
「50%,150%」都是比例值;
「比上周同時段增長...」由於是#五一放假4天#消息導致的數據短期內連續上漲,所以選擇的是周同比;
「國內機票的預定…國際機票...」飛豬是在跟自己比,若有行業數據公布作為依據,可以判斷飛豬是比同行漲的快/慢。
2、多維度拆解
多維度拆解,是最重要的一種思維方式, 一個單一指標是不具備分析價值的,我們需要從多個維度進行拆解分析才有意義,最終以獲得更加全面的數據洞察。
數據分析的本質是用不同的視角去拆分,觀察同一數據指標。多維度拆解的本質多維度拆分指標/業務流程,來觀察數據變動。
多維度拆解的適用場景:
(1) 分析單一指標的構成、比例時 ,比如分欄目的播放量、新老用戶比例;
(2) 針對流程進行拆解 ,比如不同渠道的瀏覽、購買轉化率,不同省份的活動參與漏斗;
(3) 還原行為發生時的場景 ,比如打賞主播的用戶的等級、性別、關注頻道,是否在WiFi或4G環境下。
現在回到第一個場景:「比如,某段時間公司做了一波網紅大V推廣,老闆想看看推廣效果,你需要來個復盤分析…」
這時就需要用到多維度拆解分析方法,大致的分析思路這樣這樣:
(1)從APP啟動事件來分析
按照 設備類型 查看,比如Android、iPhone…不同機型的啟動情況;
按照 啟動來源 來看,比如是從桌面、簡訊、PUSH…不同來源的啟動情況;
按照 城市等級 觀察,比如一線、二線、三線及以下…不同城市的啟動情況;
按照 新老用戶 細分,比如總體、新用戶、老用戶...不同用戶群體的啟動情況。
(2)從業務流程拆解
比如對於簡單的「注冊——>下單——>支付」流程而言:
支付漏斗按照 渠道 查看,渠道可能分為網路、頭條、微信公眾號…
支付漏斗按照 城市 來看,城市可能分為一線、二線、三線及以下…
支付漏斗按照 設備 來看,設備可能分為Android、iPhone…
3、漏斗觀察
漏斗觀察的分析方法我們常見且熟悉,它的運作原理是 通過一連串向後影響的用戶行為來觀察目標。
適用於有明確的業務流程和業務目標的業務,不適用於沒有明確的業務流程、跳轉關系紛繁復雜的業務。
通過漏斗觀察核心業務流程的健康程度。
盤點一下在建立漏斗時容易掉的坑:
(1)首先漏斗觀察需要有一定的時間窗口 ,具體需要根據業務實際情況,選擇對應的時間窗口。
按天觀察 ,適用於對用戶心智的影響只在短期內有效的情況,比如一些短期活動(當前有效,倒計時設置等);
按周觀察 ,適用於業務本身復雜,用戶決策成本高,需要跨日才能完成的情況,比如投資理財,開戶注資;
按月觀察 ,適用於用戶決策周期更長的情況,比如裝修買房。
(2)其次漏斗觀察是有嚴格順序的 ,不可以用ABCDE(僅搜索途徑的數據)的漏斗,看ACE(包含分類、搜索、推薦位三條途徑的數據)的數據 。
(3)漏斗的計算單位可以基於用戶,也可以基於時間。
觀察用戶,是關心整個業務流程的推動;
觀察事件,是關心某一步具體的轉化率,但無法獲知事件流轉的真實情況。
(4)結果指標的數據不符合預期時,需要自查是否只有一個漏斗能夠觸達最終目標 ,也就是檢查下,是否出現第二個坑的情況。
四、案例分享——某款社交APP在國慶期間數據猛漲原因分析
場景是這樣,現在有一款匿名社交APP,類似於探探,數據范圍在 2018 年 9 月 1 日 - 10 月 14 日之間,其中在國慶期間數據猛漲,試分析其原因。
(1)首先定義「數據猛漲」
作為一款匿名社交產品,可以選擇觀察「注冊成功」事件。
由於產生行為數據的時間較短,所以最後選擇關注「注冊用戶數的日環比是否有比較大的增漲」,並按照「注冊成功」事件的「觸發用戶數」進行查看:
(2)發現異常定位問題
從上面這張注冊成功的觸發用戶數折線圖可以看出,國慶期間的注冊用戶日環比存在較高的數據增長差,就是折線右側出現的一段高峰。
由此判斷,國慶期間由於某種原因造成了注冊用戶數的大幅增長,具體原因,待進一步拆解分析。
(3)多維度拆解分析
按照操作系統區分觀察,可以發現Android的漲幅明顯高於iOS,iOS稍有漲幅,但漲幅不明顯。
這一步仍無法直接定位問題,需進一步拆解分析。
上圖 按照注冊方式觀察 ,微信、微博、手機號這三種注冊方式,在國慶期間均有漲幅且漲幅相似,可初步判斷注冊方式與此次數據異常無關。
上圖 按照性別觀察 ,男生和女生在國慶期間均有漲幅,男生略高於女生,但仍無法直接定位問題,需進一步拆解分析;
上圖 按照年齡觀察 ,不同年齡層的用戶在國慶期間均有漲幅且漲幅相似,可初步判斷年齡與此次數據異常無關。
問題來了!按照省份觀察 ,上圖明顯看到有一根折現異常升高!
其實是海南省的日環比漲幅增高,除此之外,雲南省的環比漲幅相較其他省份也明顯升高。
綜上觀察分析基本可以判斷,國慶期間數據猛漲,跟海南省、雲南省的注冊用戶數大幅增長有關,具體原因待進一步拆解分析。
繼續 按照城市觀察 ,篩選條件設置為省份等於海南省,雲南省,直觀看到麗江市、大理市、三亞市、海口市國慶期間數據猛漲。
綜合以上多維度分析發現,國慶期間數據猛漲,主要是由於 麗江市、大理市、三亞市、海口市 四個城市有明顯漲幅。
而這四個城市都屬於旅遊城市,且數據增長時期伴隨國慶假期。
於是猜測可能是,該款匿名社交產品在國慶期間,面向這四個熱門旅遊目的地,做了推廣活動,關於數據猛漲真實的具體原因,還需要與市場、運營、或負責增長相關的同事溝通確認。
7. 數據分析的幾種常用方法21-10-27
幾種常見的數據分析分析方法:
1.周期性分析(基礎分析)
What :主要是從日常雜亂的數據中,發現周期性出現的現象,而從避免或改善問題的發生。常見的兩種周期:自然周期和生命周期。
需要注意的點:雖然周期性分析主要針對時間序列,但不全是,例如公眾號的文章閱讀走勢不僅和日期(工作日或周末)相關,也和文章類型相關。
例如:銷售中3,6,9,12月,由於績效考核出現的峰值
重點節假日對和交付的影響
產品銷售的季節性影響(例如北方下半年的採暖產品,入夏空調的銷售旺季等)
How: 自然後期的時間維度,根據分析的需求,可從年(同環比,業績達成、和行業趨勢對比),月(淡旺季、銷售進度、生產預測),周(一般較少),日(工作日,非工作日的差異分析),時(時間分布,工作時段,上下班高峰,晚上,主要和大眾消費行為分析相關)進行展開
生命周期一種常見的分析就「商品生命周期」,商品銷量隨上市時間的變化,通過時間軸+指標走勢組合出來的。這種分析對快消品或者產品迭代速度很快的商品(典型如手機)是比較重要的,可以用於監控產品的市場表現,對照市場活動可以量化活動效果以及產品線的經營情況,如持續跟進,則可針對性的提出產品上市的建議。
2.矩陣分析(重要分析方法)
矩陣分析是數據分析中非常重要的分析方法。主要解決分析領域的一個非常致命的核心問題:「到底指標是多少,才算好」。
平均數是一個非常常用的數據維度,但是單一維度,並不能充分評價好壞。例如考核銷售,如果只考核業務銷售業績,那麼業務人員一定會傾向賣利潤低的引流產品。那種利潤高,價格高,不容易賣的利潤型產品就沒人賣了,最後銷售越多,公司的利潤反而下降了。這個時候通過兩個維度:銷售規模和銷售利潤,構建交叉矩陣,就能將業務業績進行更有效的區分。
舉個簡單的例子,一個銷售團隊,10名銷售一個月內開發的客戶數量,產生的總業績用矩陣分析法進行分析(具體數據略):
第一步:先對客戶數量、業績求平均值
第二步:利用平均值,對每個銷售人員的客戶數量、業績進行分類
第三步:區分出多客戶+高業績,少客戶+高業績,多客戶+低業績,少客戶+低業績四類
矩陣分析把關鍵業務目標拆分為兩個維度,每個維度進行高低分類,進而可以對目標進行更加立體的描述。維度高低分類多採用 平均值作為參考 值。
注意:有兩個場景,是不適合用矩陣分析法:
一:有極大/極小值影響了平均值的時候,一般出現極大/極小值的時候,可以用: 分層分析法 。
二:兩個指標高度相關的時候,例如用戶消費金額與消費頻次,兩個指標天生高度相關,此時數據分布會集中在某一個或兩個區域,矩陣分析法的業務解讀能力接近0,可採用 相關分析法
3.結構分析
What: 結構分析是將分析的目標,向下分解,主要用於發現問題。
例如銷售分析,可以按照區域—省—市 一級級的分解,分解之後可以更好的看出影響銷售業績的影響因素在哪個位置。
結構分析可以有多個維度,取決於我們需要分析的方向。例如還是銷售分析,可以從產品構成進行拆解,也可用從業務形態拆解
How:如何進行結構分析?
第一步:定出要分析的關鍵指標(一般是業績、用戶量、DAU、利潤等等)
第二步:了解關鍵指標的構成方式(比如業績,由哪些用戶、哪些商品、哪些渠道組成)
第三步:跟蹤關鍵指標的走勢,了解指標結構變化情況
第四步:在關鍵指標出現明顯上升/下降的時候,找到變化最大的結構分類,分析問題
注意:結構分析的不足
結構分析法是一種:知其然,不知其所以然的方法。只適用於發現問題,不能解答問題
4.分層分析
What: 分層分析,是為了應對 平均值失效 的場景。典型的平均值失效例如平均工資,很多人都被「代表」。這個時候需要把收入群體分成幾類,例如土豪,普通百姓,窮光蛋等,後面進行分析時就比較清楚了。業內也有一些不同的叫法,比如應用於商品的,叫ABC分類,應用於用戶的,叫用戶分層,應用於業務的,叫二八法則。本質都是一回事。
How:如何進行分層分析
1.明確分層對象和分層指標
例如:想區分用戶消費力,分層對象就是:用戶,分層指標就是:消費金額
想區分商品銷售額,分層對象就是:商品,分層指標就是:銷售金額
想區分部銷售額,分層對象就是:分部,分層指標就是:銷售收入
2.查看數據,確認是否需要分層。分層是應對平均值失效的情況的,存在極值影響的情況,則適合分層。
3.設定分層的層級。最好的解決辦法是老闆拍板,其次可以用「二八原則」,以上述銷售業績分層為例,可以先從高到低排序,然後把累積業績佔80%的人選出來,作為「第1層級(優等)」,其他的歸為「第2層級(次等)」。有時如果顆粒度不夠,也可以用「二四六八十」法則」。
如何應用分層
分層的最大作用是幫我們看清楚:到底誰是主力 ,誰是吊車尾。從而指導業務,從人海戰術向精兵簡政思考。
根據分層的結果找出差距,進而提出(假設)差異背後可能的原因,通過其它方式進行
應用 :客戶分析,目前系統中客戶超5000個,為了更好的了解客戶結構,可以通過分層分析的方法對這5000個客戶進行分層,分層的方式通過年銷售規模,可以按照累計規模排序,一般採用4-6個層級,每個層級可以給一個標簽。例如王者客戶,腰部客戶,mini客戶等。分層後,便可以針對性的進行分析,例如客戶層級的銷售佔比,變動,各層級客戶的銷售構成,結合其它方法就可以有較全面的分析
5.漏斗分析(待補充)
6.指標拆解(待補充)
7.相關性分析(待補充)
What :兩個(或多個)因素之間的關系。例如員工人數與銷售額,市場推廣與銷售業績,天氣和銷售表現等
很多因素我們直觀的感覺到之間有聯系,相互影響,但具體的關系是什麼,如何產品影響的,可以通相關性分析來量化。
例如,客戶開拓中拜訪客戶的次數和客戶成交是否有關系?
拜訪次數多,表明客戶也感興趣,所以成功幾率大
拜訪這么多,客戶還不成交,成功幾率不大
客戶成交和拜訪關系不太大,主要看你是否能打動他
How :兩種聯系:直接關系,間接關系
直接關系 :整體指標與部分指標的關系——結構分析,例如銷售業績與各中心的業績
主指標與子指標的關系——拆解分析,例如總銷售規模和客戶數量與客戶銷售規模
前後步驟間的關系——漏斗分析:例如銷售目標和項目覆蓋率,儲備率,簽約等因素間的關系
聯系中,指標之間出現一致性的變化,基本是正常,如果出現相反的變動,則需要關注,這可能是問題所在
間接關系 :要素之間沒有直接的聯系,但存在邏輯上的連接。例如推廣多了,知名度上市,進而銷售額上升。
由於關系非顯性,需要通過處理進行評價,常用的就是散點圖和excel中的相關系數法
在明確相關性後,就可以通過改變其中一個變數來影響和控制另一個變數的發展。
注意:相關性分析也存在很大的局限。主要體現在相關性並不等同因果性。例如十年前你在院子里種了一顆樹,你發現樹每天的高度和中國近十年GDP的增速高度相關,然後這兩者間並沒有什麼實質性的聯系。此次相關性分析過程中一定注意要找到關聯的邏輯自洽。
8.標簽分析(待補充)
9.
8. 數據分析的6種常用方法
常見的6種數據分析的方法有: 直接判斷法、對比分析法、結構分析法、平均分析法、漏斗分析法、因果分析法
無需經過任何的數據對比,根據經驗直接進行判斷。
這種方法對人的要求極高,要求個人對於數據和市場的理解都極其透徹,沒有深度沉澱較長時間是做不到的,否則就成了武斷。
把數據與過去N次進行對比,常見的對比類型有:競爭對手對比、時間同比與環比、類比對比、轉化對比、特徵和屬性對比、前後變化對比的等等。
對比分析法在分析中使用頻率是最高的,因為很多數據只有在對比中才能得出好壞、析出問題。
常見分析術語:
達成: 本月實際完成銷售額與目標業績的對比。達成是用於獲取當前業績的完成進度,評估業績完成進度是否合理。業績達成了,原因是什麼?因為什麼地方足夠好?業績不達成,原因又是什麼?什麼地方出現問題?
同比: 本月實際完成業績與去年同月時期的對比。同比是用於看當前業績和去年同期業績相比有沒有增長。這是做增長的運營者關注的重要指標。同比上升了,要看上升幅度有沒有符合預期,同比下降了,要重點看下降的原因。
環比: 本月實際完成的業績與上月實際完成業績的對比。環比是用於看企業業績前後變化,如試行新的運營策略一個月後與前一個月進行對比,看運營策略是否有效,但是這需要排除其他導致數據異常的原因。
差異: 自身完成業績與競爭對手完成業績的對比。差異是用於尋找企業與同行的產品不同之處,有時是為了避開直接競爭,有時候是為了學習同行優秀之處。
註: 對比分析法要注意控制變數,盡可能保持單一變數的對比,其他條件需要保持一致,這樣的數據對比才有意義。
組內數據與總體數據之間進行對比。
常見如電商流量結構,自然搜索流量占總體的比例,付費流量占總體的比例,個性化推薦占總體的比例等等。
設置一個平均線,分析數據高於或者低於平均值的原因。
觀察流程中每一步的轉化和流失。常見如電商轉化漏斗:展現——點擊——訪問——咨詢——下單——支付等,每一步都設置數據埋點,觀察用戶行為數據,對跳失較高的步驟進行優化,提升產品功能、促銷策略、服務體驗等。
用枝狀結構畫出因果關系的圖表,把影響因素一一列出,形成因果對應,有利於制定合理的方案。
9. 常用數據分析處理方法有哪些
常用的數據分析方法有:聚類分析、因子分析、相關分析、對應分析、回歸分析、方差分析。
1、聚類分析:聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。
2、因子分析:因子分析是指研究從變數群中提取共性因子的統計技術。因子分析就是從大量的數據中尋找內在的聯系,減少決策的困難。因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發抽因法、拉奧典型抽因法等等。
3、相關分析:相關分析是研究現象之間是否存在某種依存關系,並對具體有依存關系的現象探討其相關方向以及相關程度。相關關系是一種非確定性的關系。
4、對應分析:對應分析也稱關聯分析、R-Q型因子分析,通過分析由定性變數構成的交互匯總表來揭示變數間的聯系。可以揭示同一變數的各個類別之間的差異,以及不同變數各個類別之間的對應關系。
5、回歸分析:回歸分析是確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法。運用十分廣泛,回歸分析按照涉及的自變數的多少,可分為一元回歸分析和多元回歸分析。
6、方差分析:又稱「變異數分析」或「F檢驗」,方差分析是從觀測變數的方差入手,研究諸多控制變數中哪些變數是對觀測變數有顯著影響的變數。
想要了解更多關於數據分析的相關信息,推薦選擇十方融海。十方融海作為技術創新型企業,堅持源頭核心技術創新,為用戶提供聽得懂、學得會、用得上的產品。該機構的解決方案和社會價值獲得了主流媒體報道,與廈門大學、深圳大學、華南理工大學等高校達成校企合作,探索產教融合、成人教育新模式。用科技推動教育改革,讓教育創造美好生活。