1、聚類分析(Cluster Analysis)
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標准,聚類分析能夠從樣本數據出發,自動進行分類。聚類分析所使用方法的不同,常常會得到不同的結論。不同研究者對於同一組數據進行聚類分析,所得到的聚類數未必一致。
2、因子分析(Factor Analysis)
因子分析是指研究從變數群中提取共性因子的統計技術。因子分析就是從大量的數據中尋找內在的聯系,減少決策的困難。
因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發抽因法、拉奧典型抽因法等等。這些方法本質上大都屬近似方法,是以相關系數矩陣為基礎的,所不同的是相關系數矩陣對角線上的值,採用不同的共同性□2估值。在社會學研究中,因子分析常採用以主成分分析為基礎的反覆法。
3、相關分析(Correlation Analysis)
相關分析(correlation analysis),相關分析是研究現象之間是否存在某種依存關系,並對具體有依存關系的現象探討其相關方向以及相關程度。相關關系是一種非確定性的關系,例如,以X和Y分別記一個人的身高和體重,或分別記每公頃施肥量與每公頃小麥產量,則X與Y顯然有關系,而又沒有確切到可由其中的一個去精確地決定另一個的程度,這就是相關關系。
4、對應分析(Correspondence Analysis)
對應分析(Correspondence analysis)也稱關聯分析、R-Q型因子分析,通過分析由定性變數構成的交互匯總表來揭示變數間的聯系。可以揭示同一變數的各個類別之間的差異,以及不同變數各個類別之間的對應關系。對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。
5、回歸分析
研究一個隨機變數Y對另一個(X)或一組(X1,X2,…,Xk)變數的相依關系的統計分析方法。回歸分析(regression analysis)是確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法。運用十分廣泛,回歸分析按照涉及的自變數的多少,可分為一元回歸分析和多元回歸分析;按照自變數和因變數之間的關系類型,可分為線性回歸分析和非線性回歸分析。
6、方差分析(ANOVA/Analysis of Variance)
又稱「變異數分析」或「F檢驗」,是R.A.Fisher發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。由於各種因素的影響,研究所得的數據呈現波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。方差分析是從觀測變數的方差入手,研究諸多控制變數中哪些變數是對觀測變數有顯著影響的變數。這個 還需要具體問題具體分析
『貳』 基本分析的三種分析方法的具體區別
1、技術分析著重於分析股票價格的波動規律,基本分析側重於研究股票的內在投資價值,演化分析側重於揭示股市運作的內在邏輯。
2、技術分析主要分析股票的供需表現、市場價格和交易數量等市場因素;基本分析則是分析各種經濟、政治等股票市場的外部因素及這些外部因素與股票市場相互關系;演化分析主要分析股市運作的生命運動本質特徵與屬性。
3、技術分析是針對股價漲跌表現的、屬於短期性質的;演化分析則是針對市場波動本質屬性和內在邏輯的、屬於中短期性質的;基本分析是針對企業投資價值的、屬於長期性質的,
4、技術分析可以幫助投資者選擇適當的投資機會和投資方法,基本分析有助於投資者正確地選擇股票投資的對象,演化分析則幫助投資者構建科學有效的思維方式和決策框架。
5、股票市場是一個非線性復雜適應系統。技術分析和基本分析的研究範式是線性的,正確掌握和運用技術分析和基本分析,可以使投資者更聰明地對待市場,是屬於「術」的范疇;演化分析的研究範式是非線性的,正確掌握和運用演化分析,則可以使投資者更有智慧地對待市場,是屬於「道」的范疇。
『叄』 三種數據分析方法
首先,常見的數據分析方法有9種: 對比分析,多維度拆解分析,漏斗觀察 ,分布分析,用戶留存分析,用戶畫像,歸因查找,路徑挖掘,行為序列分析。
這里將重點展開分享前三種數據分析方法: 對比分析,多維度拆解分析,漏斗觀察。
1、對比分析
對比分析是 最基礎最常見 的數據分析方法,能 直觀的看出事物某階段的變化,並且可以准確、量化地表達出這種變化/差距是多少 ,重點從「比什麼」「怎麼比」「跟誰比」三個維度進行分析。
(1)比什麼
比什麼,分為絕對值(#)和比例值(%)的比較。
絕對值本身已是具備「價值」的數據,比如銷售金額2000元,閱讀數10000萬,單看數字不易得知問題的嚴重程度;
比例值只有在具體環境中看比例才具備對比價值 ,比如活躍佔比,注冊轉化率, 單看比例值容易受到極端值的影響。
(2)怎麼比
怎麼比,分為環比和同比。
常見的環比有日環比,月環比 ,是指 與當前時間范圍相鄰的上一個時間范圍對比 ,主要用於對短期內具備連續性的數據進行分析,如指標設定;
常見的同比有周同比,年同比 ,是指 與當前時間范圍上層時間范圍的前一范圍中同樣位置進行數據對比分析 ,主要用於觀察更長期的數據集,消除短期數據的干擾。
(3)和誰比
和誰比,分為和自己比、和行業比。
和自己比 ,可以從不同的時間維度,不同的業務線,過往經驗估計,跟自己比較;
和行業比 ,可以觀察分析得出是自身因素,還是行業趨勢,比如都跌的時候,能否比同行跌的少?都漲的時候,能都比同行漲的快?
現在回到上面這條「飛豬公關數據」「放假消息公布以後,10點到12點,國內機票的預定量,比上周同時段增長超過50%;國際機票的增長更加驚人,超過了150%。」
很顯然,
「50%,150%」都是比例值;
「比上周同時段增長...」由於是#五一放假4天#消息導致的數據短期內連續上漲,所以選擇的是周同比;
「國內機票的預定…國際機票...」飛豬是在跟自己比,若有行業數據公布作為依據,可以判斷飛豬是比同行漲的快/慢。
2、多維度拆解
多維度拆解,是最重要的一種思維方式, 一個單一指標是不具備分析價值的,我們需要從多個維度進行拆解分析才有意義,最終以獲得更加全面的數據洞察。
數據分析的本質是用不同的視角去拆分,觀察同一數據指標。多維度拆解的本質多維度拆分指標/業務流程,來觀察數據變動。
多維度拆解的適用場景:
(1) 分析單一指標的構成、比例時 ,比如分欄目的播放量、新老用戶比例;
(2) 針對流程進行拆解 ,比如不同渠道的瀏覽、購買轉化率,不同省份的活動參與漏斗;
(3) 還原行為發生時的場景 ,比如打賞主播的用戶的等級、性別、關注頻道,是否在WiFi或4G環境下。
現在回到第一個場景:「比如,某段時間公司做了一波網紅大V推廣,老闆想看看推廣效果,你需要來個復盤分析…」
這時就需要用到多維度拆解分析方法,大致的分析思路這樣這樣:
(1)從APP啟動事件來分析
按照 設備類型 查看,比如Android、iPhone…不同機型的啟動情況;
按照 啟動來源 來看,比如是從桌面、簡訊、PUSH…不同來源的啟動情況;
按照 城市等級 觀察,比如一線、二線、三線及以下…不同城市的啟動情況;
按照 新老用戶 細分,比如總體、新用戶、老用戶...不同用戶群體的啟動情況。
(2)從業務流程拆解
比如對於簡單的「注冊——>下單——>支付」流程而言:
支付漏斗按照 渠道 查看,渠道可能分為網路、頭條、微信公眾號…
支付漏斗按照 城市 來看,城市可能分為一線、二線、三線及以下…
支付漏斗按照 設備 來看,設備可能分為Android、iPhone…
3、漏斗觀察
漏斗觀察的分析方法我們常見且熟悉,它的運作原理是 通過一連串向後影響的用戶行為來觀察目標。
適用於有明確的業務流程和業務目標的業務,不適用於沒有明確的業務流程、跳轉關系紛繁復雜的業務。
通過漏斗觀察核心業務流程的健康程度。
盤點一下在建立漏斗時容易掉的坑:
(1)首先漏斗觀察需要有一定的時間窗口 ,具體需要根據業務實際情況,選擇對應的時間窗口。
按天觀察 ,適用於對用戶心智的影響只在短期內有效的情況,比如一些短期活動(當前有效,倒計時設置等);
按周觀察 ,適用於業務本身復雜,用戶決策成本高,需要跨日才能完成的情況,比如投資理財,開戶注資;
按月觀察 ,適用於用戶決策周期更長的情況,比如裝修買房。
(2)其次漏斗觀察是有嚴格順序的 ,不可以用ABCDE(僅搜索途徑的數據)的漏斗,看ACE(包含分類、搜索、推薦位三條途徑的數據)的數據 。
(3)漏斗的計算單位可以基於用戶,也可以基於時間。
觀察用戶,是關心整個業務流程的推動;
觀察事件,是關心某一步具體的轉化率,但無法獲知事件流轉的真實情況。
(4)結果指標的數據不符合預期時,需要自查是否只有一個漏斗能夠觸達最終目標 ,也就是檢查下,是否出現第二個坑的情況。
四、案例分享——某款社交APP在國慶期間數據猛漲原因分析
場景是這樣,現在有一款匿名社交APP,類似於探探,數據范圍在 2018 年 9 月 1 日 - 10 月 14 日之間,其中在國慶期間數據猛漲,試分析其原因。
(1)首先定義「數據猛漲」
作為一款匿名社交產品,可以選擇觀察「注冊成功」事件。
由於產生行為數據的時間較短,所以最後選擇關注「注冊用戶數的日環比是否有比較大的增漲」,並按照「注冊成功」事件的「觸發用戶數」進行查看:
(2)發現異常定位問題
從上面這張注冊成功的觸發用戶數折線圖可以看出,國慶期間的注冊用戶日環比存在較高的數據增長差,就是折線右側出現的一段高峰。
由此判斷,國慶期間由於某種原因造成了注冊用戶數的大幅增長,具體原因,待進一步拆解分析。
(3)多維度拆解分析
按照操作系統區分觀察,可以發現Android的漲幅明顯高於iOS,iOS稍有漲幅,但漲幅不明顯。
這一步仍無法直接定位問題,需進一步拆解分析。
上圖 按照注冊方式觀察 ,微信、微博、手機號這三種注冊方式,在國慶期間均有漲幅且漲幅相似,可初步判斷注冊方式與此次數據異常無關。
上圖 按照性別觀察 ,男生和女生在國慶期間均有漲幅,男生略高於女生,但仍無法直接定位問題,需進一步拆解分析;
上圖 按照年齡觀察 ,不同年齡層的用戶在國慶期間均有漲幅且漲幅相似,可初步判斷年齡與此次數據異常無關。
問題來了!按照省份觀察 ,上圖明顯看到有一根折現異常升高!
其實是海南省的日環比漲幅增高,除此之外,雲南省的環比漲幅相較其他省份也明顯升高。
綜上觀察分析基本可以判斷,國慶期間數據猛漲,跟海南省、雲南省的注冊用戶數大幅增長有關,具體原因待進一步拆解分析。
繼續 按照城市觀察 ,篩選條件設置為省份等於海南省,雲南省,直觀看到麗江市、大理市、三亞市、海口市國慶期間數據猛漲。
綜合以上多維度分析發現,國慶期間數據猛漲,主要是由於 麗江市、大理市、三亞市、海口市 四個城市有明顯漲幅。
而這四個城市都屬於旅遊城市,且數據增長時期伴隨國慶假期。
於是猜測可能是,該款匿名社交產品在國慶期間,面向這四個熱門旅遊目的地,做了推廣活動,關於數據猛漲真實的具體原因,還需要與市場、運營、或負責增長相關的同事溝通確認。
『肆』 寫作常用方法——比較分析法
比較分析方法是自然科學、社會科學以及日常生活中常用的分析方法之一。
比較分析試圖通過事物異同點的比較,區別事物,達到對各個事物深入的了解認識,從而把握各個事物。
在調查資料的理論分析中,當需要通過比較兩個或者兩個以上事物或者對象的異同來達到某個事物的認識時,一般採用比較分析方法。
進行比較分析,應把握如下幾點:
1.橫向比較與縱向比較相結合
橫向比較是將同一時期的相關的事物進行比較。這種比較既可在不同事物之間進行,也可在同類事物內部的不同部分之間進行。通過橫向比較可以發現兩類事物或同類事物不同部分之間在某一方面的差異,進而分析出造成這種差異的原因。
縱向比較是對同一對象在不同時期的具體特點進行比較。縱向比較可以揭示認識對象在不同時期不同階段上的特點及其變化發展的趨勢。
橫向比較和縱向比較各有其長短。橫向比較的優點是現實性強,容易理解,便於掌握,它側重從質與量上對認識對象加以區分;缺點是一種靜態比較法,難以揭示事物的本質規律及發展趨勢。
縱向比較的長處在於能夠揭示事物之間的有機聯系,認識事物之間的發展趨勢;
但它往往對事物之間橫向聯系注意不夠。
因此,需要將橫向比較與縱向比較相結合,以達到對事物的深入了解和認識。
2.比較事物的相同點與相異點
比較可以在異類對象之間進行,也可以在同類對象之間進行,還可以在同一對象的不同部分之間進行。分析社會調查資料,重視同類對象和同一對象的不同方面、不同部分之間的比較。
比較事物或對象的同和異是比較分析的兩項內容。
首先是共同點的比較。確定事物或對象的共同點,包括兩個方面:一是找出共同性質,即同類事物的「同類」性,如男女職工的比較分析,「職工」就是共同性質,表明具有共同的勞動性質,這就是比較分析的前提條件。二是找出調查對象表現出來的共同特點。
其次是差異點的比較。這是比較分析主要的和重要的工作。確定差異點,就是找出調查對象表現出來的不同特點。
3.要對可比的事物作比較,不要在不可比的事物之間作比較
例如,社會指標和經濟指標的比較常常應當弄清指標的可比口徑問題,弄清指標概念的含義和指標數值的計算方法。具有相同含義和相同計算口徑的統計指標,都是可比,反之是不可比的,對於調查對象的比較來說,要選擇可比的方面開展比較分析。
4.選擇和制定精確的、穩定的比較標准
定量比較的計量單位應選擇精確統一的標准,如長度基本單位使用米,重量基本單位使用公斤,容積基本單位使用升,等等。再比如家庭生活水平,主要看人均收入水平,用人民幣為基本單位等。
定性比較的標准應具有相對穩定性,比如全面普遍開展「五好家庭」的活動,其擇定標准也應具有相對穩定性。只有選擇和制定精確的穩定的比較標准,比較分析才有章可循,得以堅持。