❶ 常用的8種數據分析方法
常用的8種數據分析方法如下:
1、邏輯樹分析方法。通過邏輯樹分析方法,可以把一個復雜的問題變成容易處理的子問題。應用場景:年度計劃,拆解成技能學習、讀書、健身、旅行等這些子問題
2、PEST分析方法—行業分析。PEST分析方法是對公司發展宏觀環境的分析,所以經常用於行業分析。通常是從政策、經濟、社會和技術這四個方面來分析的。應用場答瞎虧景:職業規劃、行業分析、產品報告。
3、多維度拆解分析方法。光看整體結果時,神橡看不到內部實際的差異,所以將復雜的問題拆解成簡單問題,指標構成來拆解從、業務流程來拆解。應用場景: 考察公眾號、網路、頭條哪個渠道用戶來源多。
4、比分析方法—通過兩個對比得出最優結果。想要進行對比分析,首先要弄清楚兩個問題:和誰比,如清神何比較。
這一過程是質量管理體系的支持過程。在產品的整個壽命周期,包括從市場調研到售後服務和最終處置的各個過程都需要適當運用數據分析過程,以提升有效性。數據分析過程的主要活動由識別信息需求、收集數據、分析數據、評價並改進數據分析的有效性組成。
例如,設計人員在開始一個新的設計以前,要通過廣泛的設計調查,分析所得數據以判定設計方向,因此數據分析在工業設計中具有極其重要的地位。
❷ 九大常用數據分析方法 帶大家了解一下這些干貨吧
1、直接評判法
直接評判法即根據經驗直接判斷數據的好壞並給予評判,通常用於內部過往運營狀況評估,如評估近期閱讀量是否過低,評判近期銷售量是否異常,評估當日文章推送量是否正常。
直接評判法有兩個必要的條件:一是運營者有一定的新媒體運營經驗,能夠對跳出率,閱讀量等有正確的評估;二是經過加工處理的數據足夠直觀,可以直接代表某項數據的優缺點。
2、對比分析法
對比分析法,是將兩個或兩個以上的數據進行對比,分析差異進而揭示這些數據所代表的規律。
對比分析法包括橫向比較及縱向比較。橫向比較即同一時間下不同總體指標的對比,如今日頭條同領域作者文章閱讀量對比,粉絲數對比等;縱向比較不同時間條件下同一總體指標的對比,如本月文章閱讀量與上月閱讀量進行對比,本月粉絲增長數與上月增長數進行對比等。
通過對比分析,可以直接觀察到目前的運營水平,一方面找到當前已經處於優秀水平的方面,後續予以保持;另一方面及時發現當前的薄弱環節,重點突破。
3、分組分析法
分組分析法是指通過一定的指標,將對象統計分組並計算和分析,以便於深入了解所要分析對象的不同特徵,性質及相互關系的方法。
分組分析法遵循相互獨立,完全窮盡的枚舉分析法原則。所謂相互獨立,即分組之間不能有交叉,組別之間具有明顯的差異性,每個數據只能歸屬於某一組;所謂完全窮盡,即分組中不要遺漏任何數據,保持完整性,各組的空間足以容納總體的所有數據。
4、結構分析法
結構分析法是在統計分組的基礎上,將組內數據與總體數據之間進行對比的分析方法。結構分析法分析各組部分佔總體的比例,屬於相對指標。
例如,新媒體運營團隊可以統計粉絲所在的地域分布,統計出各個地方粉絲的佔比情況,此情景便屬於結構分析法。
5、平均分析法
例如,在分析今日頭條的文章閱讀量時,藉助Excel導出的數據可以快速找到閱讀量大於平均值的文章,接下來可以繼續挖掘這些文章的標題,排版,配圖等規律,便於後續內容質量的提升。
6、矩陣分析法
矩陣分析法是一種定量分析問題的方法,它是指以數據兩個重要指標作為分析依據,並將這兩個指標作為橫,縱坐標軸,構成四個象限,從而找出解決問題的辦法,為運營者提供數據參考。
例如,某餐飲企業的大眾點評評價分析,可以藉助四個象限「緊急且重要,重要但不緊急,緊急但不重要,不緊急也不重要」進行矩陣分析,並重點處理「緊急且重要」的事項。
7、漏斗圖分析法
漏斗圖分析法因展現形式如漏斗,故而得名。漏斗圖可以對文章閱讀量,產品購買量等情況進行逐層分析,展示整個關鍵路徑中每步的轉化情況。
重要強調的是,單一的漏斗圖難以衡量各個環節的好壞,運營者可以結合本節介紹的「對比分析法」,對同一環節不同時間對比,評估運營效果。
8、雷達圖分析法
雷達圖常用於指數分析,即通過對新媒體賬號的內容質量,領域專注等不同維度的計算而得出的客觀評分結果。分數越高,代表賬號的質量越好。可以利用雷達圖進行分析的指數,包括今日頭條指數,大魚號星級指數,百家號指數等。
9、回歸分析法
回歸分析法是通過研究事物發展變化的因果關系來預測事物發展走向,它是研究變數間相互關系的一種定量預測方法,又稱回歸模型預測法或因果法。
例如,將今日頭條粉絲數據導出到Excel表格,對累計粉絲數進行一元線性分析,就可以嘗試預測某個時間的粉絲量。
1、對比分析法:常用於對縱向的、橫向的、最為突出的、計劃與實際的等各種相關數據的。例如:今年與去年同期工資收入的增長情況、3月CPI環比增長情況等。
2、趨勢分析法:常用於在一段時間周期內,通過分析數據運行的變化趨勢(上升或下降),為未來的發展方向提供幫助。例如:用電量的季節性波動、股市的漲跌趨勢等。
3、相關分析法:常用於分析兩個或多個變數之間的性質以及相關程度。例如:氣溫與用電量的相關性、運動量大小與體重的相關性等。
4、回歸分析法:常用於分析一個或多個自變數的變化對一個特定因變數的影響程度,從而確定其關系。例如:氣溫、用電設備、用電時長等因素對用電量數值大小的影響程度、工資收入的高低對生活消費支出大小的影響程度等。
5、描述性分析法:常用於對一組數據樣本的各種特徵進行分析,以便於描述樣本的各種及其所代表的總體的特徵。例如:本月日平均用電量、上海市工資收入中位數等。
6、結構分析法:常用於分析數據總體的內部特徵、性質和變化規律等。例如:各部分用電量占總用電的比重、生活消費支出構成情況等。
❹ 16種常用的數據分析方法匯總
一、描述統計
描述性統計是指運用製表和分類,圖形以及計筠概括性數據來描述數據的集中趨勢、離散趨勢、偏度、峰度。
1、缺失值填充:常用方法:剔除法、均值法、最小鄰居法、比率回歸法、決策樹法。
2、正態性檢驗:很多統計方法都要求數值服從或近似服從正態分布,所以之前需要進行正態性檢驗。常用方法:非參數檢驗的K-量檢驗、P-P圖、Q-Q圖、W檢驗、動差法。
二、假設檢驗
1、參數檢驗
參數檢驗是在已知總體分布的條件下(一股要求總體服從正態分布)對一些主要的參數(如均值、百分數、方差、相關系數等)進行的檢驗 。
1)U驗 使用條件:當樣本含量n較大時,樣本值符合正態分布
2)T檢驗 使用條件:當樣本含量n較小時,樣本值符合正態分布
A 單樣本t檢驗:推斷該樣本來自的總體均數μ與已知的某一總體均數μ0 (常為理論值或標准值)有無差別;
B 配對樣本t檢驗:當總體均數未知時,且兩個樣本可以配對,同對中的兩者在可能會影響處理效果的各種條件方面扱為相似;
C 兩獨立樣本t檢驗:無法找到在各方面極為相似的兩樣本作配對比較時使用。
2、非參數檢驗
非參數檢驗則不考慮總體分布是否已知,常常也不是針對總體參數,而是針對總體的某些一股性假設(如總體分布的位罝是否相同,總體分布是否正態)進行檢驗。
適用情況:順序類型的數據資料,這類數據的分布形態一般是未知的。
A 雖然是連續數據,但總體分布形態未知或者非正態;
B 體分布雖然正態,數據也是連續類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、遊程檢驗、K-量檢驗等。
三、信度分析
檢査測量的可信度,例如調查問卷的真實性。
分類:
1、外在信度:不同時間測量時量表的一致性程度,常用方法重測信度
2、內在信度;每個量表是否測量到單一的概念,同時組成兩表的內在體項一致性如何,常用方法分半信度。
四、列聯表分析
用於分析離散變數或定型變數之間是否存在相關。
對於二維表,可進行卡方檢驗,對於三維表,可作Mentel-Hanszel分層分析。
列聯表分析還包括配對計數資料的卡方檢驗、行列均為順序變數的相關檢驗。
五、相關分析
研究現象之間是否存在某種依存關系,對具體有依存關系的現象探討相關方向及相關程度。
1、單相關: 兩個因素之間的相關關系叫單相關,即研究時只涉及一個自變數和一個因變數;
2、復相關 :三個或三個以上因素的相關關系叫復相關,即研究時涉及兩個或兩個以上的自變數和因變數相關;
3、偏相關:在某一現象與多種現象相關的場合,當假定其他變數不變時,其中兩個變數之間的相關關系稱為偏相關。
六、方差分析
使用條件:各樣本須是相互獨立的隨機樣本;各樣本來自正態分布總體;各總體方差相等。
分類
1、單因素方差分析:一項試驗只有一個影響因素,或者存在多個影響因素時,只分析一個因素與響應變數的關系
2、多因素有交互方差分析:一頊實驗有多個影響因素,分析多個影響因素與響應變數的關系,同時考慮多個影響因素之間的關系
3、多因素無交互方差分析:分析多個影響因素與響應變數的關系,但是影響因素之間沒有影響關系或忽略影響關系
4、協方差分祈:傳統的方差分析存在明顯的弊端,無法控制分析中存在的某些隨機因素,使之影響了分祈結果的准確度。協方差分析主要是在排除了協變數的影響後再對修正後的主效應進行方差分析,是將線性回歸與方差分析結合起來的一種分析方法,
七、回歸分析
分類:
1、一元線性回歸分析:只有一個自變數X與因變數Y有關,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布。
2、多元線性回歸分析
使用條件:分析多個自變數與因變數Y的關系,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布 。
1)變呈篩選方式:選擇最優回歸方程的變里篩選法包括全橫型法(CP法)、逐步回歸法,向前引入法和向後剔除法
2)橫型診斷方法:
A 殘差檢驗: 觀測值與估計值的差值要艱從正態分布
B 強影響點判斷:尋找方式一般分為標准誤差法、Mahalanobis距離法
C 共線性診斷:
診斷方式:容忍度、方差擴大因子法(又稱膨脹系數VIF)、特徵根判定法、條件指針CI、方差比例
處理方法:增加樣本容量或選取另外的回歸如主成分回歸、嶺回歸等
3、Logistic回歸分析
線性回歸模型要求因變數是連續的正態分布變里,且自變數和因變數呈線性關系,而Logistic回歸模型對因變數的分布沒有要求,一般用於因變數是離散時的情況
分類:
Logistic回歸模型有條件與非條件之分,條件Logistic回歸模型和非條件Logistic回歸模型的區別在於參數的估計是否用到了條件概率。
4、其他回歸方法 非線性回歸、有序回歸、Probit回歸、加權回歸等
八、聚類分析
樣本個體或指標變數按其具有的特性進行分類,尋找合理的度量事物相似性的統計量。
1、性質分類:
Q型聚類分析:對樣本進行分類處理,又稱樣本聚類分祈 使用距離系數作為統計量衡量相似度,如歐式距離、極端距離、絕對距離等
R型聚類分析:對指標進行分類處理,又稱指標聚類分析 使用相似系數作為統計量衡量相似度,相關系數、列聯系數等
2、方法分類:
1)系統聚類法: 適用於小樣本的樣本聚類或指標聚類,一般用系統聚類法來聚類指標,又稱分層聚類
2)逐步聚類法 :適用於大樣本的樣本聚類
3)其他聚類法 :兩步聚類、K均值聚類等
九、判別分析
1、判別分析:根據已掌握的一批分類明確的樣品建立判別函數,使產生錯判的事例最少,進而對給定的一個新樣品,判斷它來自哪個總體
2、與聚類分析區別
1)聚類分析可以對樣本逬行分類,也可以對指標進行分類;而判別分析只能對樣本
2)聚類分析事先不知道事物的類別,也不知道分幾類;而判別分析必須事先知道事物的類別,也知道分幾類
3)聚類分析不需要分類的歷史資料,而直接對樣本進行分類;而判別分析需要分類歷史資料去建立判別函數,然後才能對樣本進行分類
3、進行分類 :
1)Fisher判別分析法 :
以距離為判別准則來分類,即樣本與哪個類的距離最短就分到哪一類, 適用於兩類判別;
以概率為判別准則來分類,即樣本屬於哪一類的概率最大就分到哪一類,適用於
適用於多類判別。
2)BAYES判別分析法 :
BAYES判別分析法比FISHER判別分析法更加完善和先進,它不僅能解決多類判別分析,而且分析時考慮了數據的分布狀態,所以一般較多使用;
十、主成分分析
將彼此梠關的一組指標變適轉化為彼此獨立的一組新的指標變數,並用其中較少的幾個新指標變數就能綜合反應原多個指標變數中所包含的主要信息 。
十一、因子分析
一種旨在尋找隱藏在多變數數據中、無法直接觀察到卻影響或支配可測變數的潛在因子、並估計潛在因子對可測變數的影響程度以及潛在因子之間的相關性的一種多元統計分析方法
與主成分分析比較:
相同:都能夠起到済理多個原始變數內在結構關系的作用
不同:主成分分析重在綜合原始變適的信息.而因子分析重在解釋原始變數間的關系,是比主成分分析更深入的一種多元統計方法
用途:
1)減少分析變數個數
2)通過對變數間相關關系探測,將原始變數進行分類
十二、時間序列分析
動態數據處理的統計方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題;時間序列通常由4種要素組成:趨勢、季節變動、循環波動和不規則波動。
主要方法:移動平均濾波與指數平滑法、ARIMA橫型、量ARIMA橫型、ARIMAX模型、向呈自回歸橫型、ARCH族模型
十三、生存分析
用來研究生存時間的分布規律以及生存時間和相關因索之間關系的一種統計分析方法
1、包含內容:
1)描述生存過程,即研究生存時間的分布規律
2)比較生存過程,即研究兩組或多組生存時間的分布規律,並進行比較
3)分析危險因素,即研究危險因素對生存過程的影響
4)建立數學模型,即將生存時間與相關危險因素的依存關系用一個數學式子表示出來。
2、方法:
1)統計描述:包括求生存時間的分位數、中數生存期、平均數、生存函數的估計、判斷生存時間的圖示法,不對所分析的數據作出任何統計推斷結論
2)非參數檢驗:檢驗分組變數各水平所對應的生存曲線是否一致,對生存時間的分布沒有要求,並且檢驗危險因素對生存時間的影響。
A 乘積極限法(PL法)
B 壽命表法(LT法)
3)半參數橫型回歸分析:在特定的假設之下,建立生存時間隨多個危險因素變化的回歸方程,這種方法的代表是Cox比例風險回歸分析法
4)參數模型回歸分析:已知生存時間服從特定的參數橫型時,擬合相應的參數模型,更准確地分析確定變數之間的變化規律
十四、典型相關分析
相關分析一般分析兩個變里之間的關系,而典型相關分析是分析兩組變里(如3個學術能力指標與5個在校成績表現指標)之間相關性的一種統計分析方法。
典型相關分析的基本思想和主成分分析的基本思想相似,它將一組變數與另一組變數之間單變數的多重線性相關性研究轉化為對少數幾對綜合變數之間的簡單線性相關性的研究,並且這少數幾對變數所包含的線性相關性的信息幾乎覆蓋了原變數組所包含的全部相應信息。
十五、R0C分析
R0C曲線是根據一系列不同的二分類方式(分界值或決定閾).以真陽性率(靈敏度)為縱坐標,假陽性率(1-特異度)為橫坐標繪制的曲線
用途:
1、R0C曲線能很容易地査出任意界限值時的對疾病的識別能力
用途
2、選擇最佳的診斷界限值。R0C曲線越靠近左上角,試驗的准確性就越高;
3、兩種或兩種以上不同診斷試驗對疾病識別能力的比較,一股用R0C曲線下面積反映診斷系統的准確性。
十六、其他分析方法
多重響應分析、距離分祈、項目分祈、對應分祈、決策樹分析、神經網路、系統方程、蒙特卡洛模擬等。
❺ 數據分析的方法
數據分析通常包括以下幾個步驟:
數據收集:獲取需要分析的數據,可以是從各種數據源收集數據或者自己採集數據。
數據清洗:對數據進行清理和整理,包括去除重復數據、缺失數據、異常數據、格式轉換等操作,使數據能夠被更好地分析和利用。
數據探索:對數據進行可視化展示和統計分析,探索數據的分布、特徵、關系和趨勢等。
數據建模:根據數據分析的結果,利用統計學方法或機器學習演算法構建模型,用於預測和分析未來的數據情況。
數據解釋:將數據分析的結果進行解釋和應用,為決策提供支持和參考。
而對於更具體的數據分析方法,我將依次列舉:
描述性統計:用於描述數據的分布、中心位置、離散程度和對稱性等特徵。常用的描述性統計方法包括均值、中位數、標准差、偏度、峰度等。
假設檢驗:用於檢驗某個假鏈旦設是否成立,例如檢驗兩組數據之間的差異是否顯著。常用的假設檢驗方法包括t檢驗、ANOVA分析、卡方檢驗等。
相關分析:用於分析兩個或多個變數之間的關系。常用的相關分析方法包括皮爾遜相關系數、斯皮爾曼相關系數、卡方檢驗等。
回歸分析:用於研究一個或多個自變數與一個因變數之間的關系。常用的回歸分析方法包括線性回歸、邏輯回歸、多元回歸等。
聚類分析:用於將數據集中的樣本劃分為若干個互不重疊的子集,每個子集內部的樣本相似度較高,不同子集之間的樣本相似度較低。常用的聚類分析方法包括K均值聚類、層次聚類等。
分類分析:用於根據已知樣本的特徵,對未知樣本進行分類。常用的分類分析方法包括決策樹、支持向量機、樸素貝葉斯等。
時間序列分析:用於研究時間序列數據的規律和趨勢,常用於經濟、金融和股市等領域。常用的時間序列分析方法包括ARIMA模型、指數平滑模型、神經網路模型等。
以上是常見的數據分析方法
❻ 數據分析的方法有哪些
數據清理:收集的原始數據通常需要清洗和轉換以便有效分析,數據清理主要包括完整性檢查、格式轉換、缺失值處理、異常值處理等。
數據可視化:通過數據可視化,可以將復雜的數據變得更加直觀和易於理解,可視化數據分析技術包括柱狀圖、折線圖、餅圖、散點圖、平行坐標圖等。
數據挖掘:數據挖掘是一種從大量數據中查找隱藏信息的技術,常用的數據挖掘技術有關聯規則挖掘、分類、聚類、異常檢測等。
統計推斷:統計推斷通常用來從樣本數據中推斷總體情況,常用的統計推斷方法包括卡方檢驗、t檢驗、線性回歸分析等。
機器學習:機器學習是一種從數據中學習規律,並預測未知數據的一種技術,常用的機器學習方法包括決策樹、貝葉斯分類器、支持向量機、K-means聚類等。
t檢驗是一種常用的假設檢驗方法,可以用來檢驗一個樣本的平均值是否與總體平均值相同。舉個例子,假設一家公司想要知道女員工的平均工資是否與整個公司的平均工資相同,於是他們抽取了20名女員工的工資數據,然後計游慶算出了女員工的平均工資。接下來,他們使用t檢驗來檢驗女員工的平均工資是否與整個公司的平均工資相同。首先,他們需要計算樣本的t統計量,然後計算出p值,最後根據p值來判斷他們的假設是否成立。如果p-value小於某個顯著性水平(通常設定為0.05),則可以拒絕原假設,即女員工的平均工資與整個公司的平均工資不相同。
卡方檢驗是一種常用的獨立性檢驗方法,可以用來檢驗兩個變數之間是否存在獨立性。舉個例子,假設一家公司想要知道員工的性別是否與部門之間存在獨立性。於是他們抽取了200名員工,並分別記錄了他們的性別和部門信息。接下來,他們使碧磨舉用卡方檢驗來檢驗員工的性別是否與部門獨立。首先,他們需悔碧要構建一個2X2的混淆矩陣,然後計算出卡方統計量,最後根據卡方統計量計算出p值,然後根據p值來判斷他們的假設是否成立。如果p-value小於某個顯著性水平(通常設定為0.05),則可以拒絕原假設,即員工的性別與部門不獨立。
線性回歸分析是一種常用的數據分析方法,可以用來預測一個樣本的數值型輸出變數,可以用來研究兩個或多個變數之間的關系。舉個例子,假設一家公司想要知道員工工資水平與工作年限之間的關系,於是他們抽取了100名員工的工資和工作年限的數據,然後使用線性回歸分析來探究這兩個變數之間的關系。首先,他們需要計算出擬合函數的參數,然後評估擬合模型的精度,最後根據擬合模型的精度來判斷兩個變數之間的關系。如果精度高,則可以認為員工工資水平與工作年限之間存在一定的關系。
1. SWOT分析:SWOT分析是一種綜合考慮企業內外環境的分析方法,通過識別企業內部的優勢和劣勢,以及外部的機會和威脅,可以幫助企業制定有效的戰略。
2. 波士頓矩陣:波士頓矩陣是一種用於識別企業可利用的產品和市場的工具,可以幫助企業確定其市場營銷策略。
3. PEST分析:PEST分析是一種評估企業外部環境的綜合分析方法,可以幫助企業識別政治、經濟、社會和技術四個外部環境要素中的機會和威脅。
4. 生命周期分析:生命周期分析是一種用於評估產品或服務在市場上的表現情況的工具,可以幫助企業制定更有針對性的營銷策略。
5. 五力分析:五力分析是一種評估企業所處的市場環境的工具,可以幫助企業了解其市場的競爭態勢,並制定更有效的策略。
❼ 常用的數據分析方法有哪些
常用的列了九種供參考:
一、公式拆解
所謂公式拆解法就是針對某個指標,用公式層層分解該指標的影響因素。
舉例:分析某產品的銷培吵售額較低的原因,用公式法分解
二、對比分析
對比法就是用兩組或兩組以上的數據進行比較,是最通用的方法。
我們知道孤立的數據沒有意義,有對比才有差異。比如在時間維度上的同比和環比、增長率配閉侍、定基比,與競爭對手的對比、類別之間的對比、特徵和屬性對比等。對比法可以發現數據變化規律,使用頻繁,經常和其他方法搭配使用。
下圖的AB公司銷售額對比,雖然A公司銷售額總體上漲且高於B公司,但是B公司的增速迅猛,高於A公司,即使後期增速下降了,最後的銷售額還是趕超。
三、A/Btest
A/Btest,是將Web或App界面或流程的兩個或多個版本,在同一時間維度,分別讓類似訪客群組來訪問,收集各群組的用戶體驗數據和業務數據,最後分析評估出最好版本正式採用。A/Btest的流程如下:
(1)現狀分析並建立假設:分析業務數據,確定當前最關鍵的改進點,作出優化改進的假設,提出優化建議;比如說我們發現用戶的轉化率不高,我們假設是因為推廣的著陸頁面帶來的轉化率太低,下面就要想辦法來進行改進了
(2)設定目標,制定方案:設置主要目標,用來衡量各優化版本的優劣;設置輔助目標,用來評估優化版本對其他方面的影響。
(3)設計與開發:製作2個或多個優化版本的設計原型並完成技術實現。
(4)分配流量:確定每個線上測試版本的分流比例,初始階段,優化方案的流量設置可以較小,根據情況逐漸增加流量。
(5)採集並分析數據:收集實驗數據,進行有效性和效果判斷:統計顯著性達到95%或以上並且維持一段時間,實驗可以結束;如果在95%以下,則可能需要延長測試時間;如果很長時間統計顯著性不能達到95%甚至90%,則需要決定是否中止試驗。
(6)最後:根據試驗結果確定發布新版本、調整分流比例繼續測試或者在試驗效果未達成的情況下繼續優化迭代方案重新開發上線試驗。
流程圖如下:
四、象限分析
通過對兩種及以上維度的劃分,運用坐標的方式表達出想要的價值。由價值直接轉變為策略,從而進行一些落地的推動。象限法是一種策略驅動的思維,常與產品分析、市場分析、客戶管理、商品管理等。比如,下圖是一個廣告點擊的四象限分布,X軸從左到右表示從低到高,Y軸從下到上表示從低到高。
象限法的優勢:
(1)找到問題的共性原因
通過象限分析法,將有相同特徵的事件進行歸因分析,總結其中的共性原因。例如上面廣告的案例中,第一象限的事件可以提煉出有效的推廣渠道與推廣策略,第三和第四象限可以排除一些無效的推廣渠道;
(2)建立分組優化策略
五、帕累托分析
帕累托法則,源於經典的二八法則。比如在個人財富上可以說世界上20%的人掌握著80%的財富。而在數據分析中,則可以理解為20%的數據產生了80%的效果需要圍繞這20%的數據進行挖掘。往往在使用二八法則的時候和排名有關系,排在前20%的才算是有效數據。二八法是抓重點分析,適用於任何行業。找到重點,發現其特徵,然後可以思考如何讓其餘的80%向這20%轉化,提高效果。
一般地,會用在產品分類上,去測量並構建ABC模型。比如某零售企業有500個SKU以及這些SKU對應的銷售額,那麼哪些SKU是重要的呢,這就是在業務運營中分清主次的問題。
常見的做法是將產品SKU作為維度,並將對應的銷售額作為基礎度量指標,將這些銷售額指標從大到小排列,並計算截止當前產品SKU的銷售額累計合計占總銷售額的百分比。
百分比在70%(含)以內,劃分為A類。百分比在70~90%(含)以內,劃分為B類。百分比在90~100%(含)以內,劃分為C類。以上百分比也可以根據自己的實際情況調整。
ABC分析模型,不光可以用來劃分產品和銷售額,還可以劃分客戶及客戶交易額等。比如給企業貢獻80%利潤的客戶是哪些,佔比多少。假設有20%,那麼在資源有限的情況下,就知道要重點維護這20%類客戶。
六、漏斗分析
漏鬥法即是漏斗圖,有點像倒金字塔,是一個流程化的思考方式,常用於像新用戶的開發、購物轉化率這些有變化和一定態賣流程的分析中。
上圖是經典的營銷漏斗,形象展示了從獲取用戶到最終轉化成購買這整個流程中的一個個子環節。相鄰環節的轉化率則就是指用數據指標來量化每一個步驟的表現。所以整個漏斗模型就是先將整個購買流程拆分成一個個步驟,然後用轉化率來衡量每一個步驟的表現,最後通過異常的數據指標找出有問題的環節,從而解決問題,優化該步驟,最終達到提升整體購買轉化率的目的。
整體漏斗模型的核心思想其實可以歸為分解和量化。比如分析電商的轉化,我們要做的就是監控每個層級上的用戶轉化,尋找每個層級的可優化點。對於沒有按照流程操作的用戶,專門繪制他們的轉化模型,縮短路徑提升用戶體驗。
還有經典的黑客增長模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用戶獲取、用戶激活、用戶留存、用戶收益以及用戶傳播。這是產品運營中比較常見的一個模型,結合產品本身的特點以及產品的生命周期位置,來關注不同的數據指標,最終制定不同的運營策略。
從下面這幅AARRR模型圖中,能夠比較明顯的看出來整個用戶的生命周期是呈現逐漸遞減趨勢的。通過拆解和量化整個用戶生命周期各環節,可以進行數據的橫向和縱向對比,從而發現對應的問題,最終進行不斷的優化迭代。
七、路徑分析
用戶路徑分析追蹤用戶從某個開始事件直到結束事件的行為路徑,即對用戶流向進行監測,可以用來衡量網站優化的效果或營銷推廣的效果,以及了解用戶行為偏好,其最終目的是達成業務目標,引導用戶更高效地完成產品的最優路徑,最終促使用戶付費。如何進行用戶行為路徑分析?
(1)計算用戶使用網站或APP時的每個第一步,然後依次計算每一步的流向和轉化,通過數據,真實地再現用戶從打開APP到離開的整個過程。
(2)查看用戶在使用產品時的路徑分布情況。例如:在訪問了某個電商產品首頁的用戶後,有多大比例的用戶進行了搜索,有多大比例的用戶訪問了分類頁,有多大比例的用戶直接訪問的商品詳情頁。
(3)進行路徑優化分析。例如:哪條路徑是用戶最多訪問的;走到哪一步時,用戶最容易流失。
(4)通過路徑識別用戶行為特徵。例如:分析用戶是用完即走的目標導向型,還是無目的瀏覽型。
(5)對用戶進行細分。通常按照APP的使用目的來對用戶進行分類。如汽車APP的用戶可以細分為關注型、意向型、購買型用戶,並對每類用戶進行不同訪問任務的路徑分析,比如意向型的用戶,他進行不同車型的比較都有哪些路徑,存在什麼問題。還有一種方法是利用演算法,基於用戶所有訪問路徑進行聚類分析,依據訪問路徑的相似性對用戶進行分類,再對每類用戶進行分析。
以電商為例,買家從登錄網站/APP到支付成功要經過首頁瀏覽、搜索商品、加入購物車、提交訂單、支付訂單等過程。而在用戶真實的選購過程是一個交纏反復的過程,例如提交訂單後,用戶可能會返回首頁繼續搜索商品,也可能去取消訂單,每一個路徑背後都有不同的動機。與其他分析模型配合進行深入分析後,能為找到快速用戶動機,從而引領用戶走向最優路徑或者期望中的路徑。
用戶行為路徑圖示例:
八、留存分析
用戶留存指的是新會員/用戶在經過一定時間之後,仍然具有訪問、登錄、使用或轉化等特定屬性和行為,留存用戶占當時新用戶的比例就是留存率。留存率按照不同的周期分為三類,以登錄行為認定的留存為例:
第一種日留存,日留存又可以細分為以下幾種:
(1)次日留存率:(當天新增的用戶中,第2天還登錄的用戶數)/第一天新增總用戶數
(2)第3日留存率:(第一天新增用戶中,第3天還有登錄的用戶數)/第一天新增總用戶數
(3)第7日留存率:(第一天新增用戶中,第7天還有登錄的用戶數)/第一天新增總用戶數
(4)第14日留存率:(第一天新增用戶中,第14天還有登錄的用戶數)/第一天新增總用戶數
(5)第30日留存率:(第一天新增用戶中,第30天還有登錄的用戶數)/第一天新增總用戶數
第二種周留存,以周度為單位的留存率,指的是每個周相對於第一個周的新增用戶中,仍然還有登錄的用戶數。
第三種月留存,以月度為單位的留存率,指的是每個月相對於第一個周的新增用戶中,仍然還有登錄的用戶數。留存率是針對新用戶的,其結果是一個矩陣式半面報告(只有一半有數據),每個數據記錄行是日期、列為對應的不同時間周期下的留存率。正常情況下,留存率會隨著時間周期的推移而逐漸降低。下面以月留存為例生成的月用戶留存曲線:
九、聚類分析
聚類分析屬於探索性的數據分析方法。通常,我們利用聚類分析將看似無序的對象進行分組、歸類,以達到更好地理解研究對象的目的。聚類結果要求組內對象相似性較高,組間對象相似性較低。在用戶研究中,很多問題可以藉助聚類分析來解決,比如,網站的信息分類問題、網頁的點擊行為關聯性問題以及用戶分類問題等等。其中,用戶分類是最常見的情況。
常見的聚類方法有不少,比如K均值(K-Means),譜聚類(SpectralClustering),層次聚類(HierarchicalClustering)。以最為常見的K-means為例,:
可以看到,數據可以被分到紅藍綠三個不同的簇(cluster)中,每個簇應有其特有的性質。顯然,聚類分析是一種無監督學習,是在缺乏標簽的前提下的一種分類模型。當我們對數據進行聚類後並得到簇後,一般會單獨對每個簇進行深入分析,從而得到更加細致的結果。