導航:首頁 > 研究方法 > 數據分析框架和方法詳解

數據分析框架和方法詳解

發布時間:2022-08-23 15:18:57

怎麼進行數據分析

進行數據分析:

1、要求明確:准確

明確需求主要是與他人溝通與需求相關的一切內容,並清晰准確地理解和表達相關內容。

在需求溝通中,通過掌握需求的核心內容,可以減少反復溝通。需求的核心內容可以從分析目的、分析主體、分析口徑、分析思路、完成時間五個方面來確定。此外,在溝通的過程中,可以適當提出自己的想法,讓需求更加清晰立體。

2、確定思路:全面、深入

分析思想是分析的靈魂,是細化分析工作的過程。分析思路清晰有邏輯,能有效避免反復分析問題。從分析目的出發,全面、深入地拆解分析維度,確定分析方法,最終形成完整的分析框架。

3、處理數據:高效

當我們進行數據分析時,我們可能會得到混亂的數據,這就要求我們清潔、整理、快速、准確地加工成適合數據分析的風格。

此時需要使用數據分析軟體以工作流的形式提取數據模型的語義,通過易於操作的可視化工具將數據加工成具有語義一致性和完整性的數據模型。系統支持的數據預處理方法包括:采樣、拆分、過濾和映射、列選擇、空值處理、並行、合並行、元數據編輯、JOIN、行選擇、重復值去除等。

4、數據分析:合適的數據

分析數據在分析過程中的地位是首要任務。從分析的目的出發,運用適當的分析方法或模型,使用分析工具分析處理過的數據,提取有價值的信息。

5、顯示數據:直觀

展示數據又稱數據可視化,是以簡單直觀的方式傳達數據中包含的信息,增強數據的可讀性,讓讀者輕松看到數據表達的內容。

6、寫報告:建議落地,邏輯清晰

撰寫報告是指以文件的形式輸出分析結果,其內容是通過全面科學的數據分析來顯示操作,可以為決策者提供強有力的決策依據,從而降低操作風險,提高利潤。

在撰寫報告時,為了使報告更容易閱讀和有價值,需要注意在報告中註明分析目標、口徑和數據來源;報告應圖文並茂,組織清晰,邏輯性強,單一推理;報告應反映有價值的結論和建議。

7、效果反饋:及時

所謂效果反饋,就是選擇合適有代表性的指標,及時監控報告中提出的戰略執行進度和執行效果。只有輸入和輸出才能知道自己的操作問題點和閃點,所以效果反饋是非常必要的。反饋時要特別注意兩點,一是指標要合適,二是反饋要及時。

㈡ 一份完整的數據分析報告

一份完整的數據分析報告

一份完整的數據分析報告。現代社會屬於大數據時代,而數據分析報告是非常重要的,一份完整的數據分析報告並不好寫。接下來就由我帶大家詳細的了解下一份完整的數據分析報告的相關內容。

一份完整的數據分析報告1

報告是項目的結果展示,是數據分析結果的有效承載形式。一份思路清晰,言簡意賅地數據分析報告能直戳問題痛點,提高溝通效率,獲得領導賞識。

對於數據分析報告,首先要有一個概念性的認識,按照報告陳述的思路,可分為四類:

這四類報告由淺入深,分析難度遞增,對企業決策的支持程度也遞增,尤其是當企業面臨某個決策難題時,分析工作要做得足夠系統和深刻。

這四類報告我們可以做個比喻。

描述類報告類似記敘文,像個掃描儀一樣描繪市場輪廓,不求最深但求最全。

因果類報告類似議論文,像打水井,集中一點,一直探到底。

預測類報告類似科幻小說,像個預言家,根據市場的過去推斷市場的未來。

咨詢類報告類似推理小說,像小馬過河,投石問路,根據分析結論指導企業一路前行。

報告結構

撰寫報告前先理清楚三個問題:

什麼內容?用什麼結構?如何論述?

寫什麼內容由決策難題決定,是投資?戰略?營銷還是其他,相應的報告也就有了相應的內容。

好的報告要求重點突出、主次分明、層次清晰。報告要依附內容的分析以及領導或其他人的閱讀習慣,但最重要的是遵循一定的結構化思維。

報告的常見構成

舉個例子,比如我用PPT展示一個網民調查的報告

1、標題頁: 標題頁用於寫報告題目,為了方便歸檔,日夜也應當註明,還有報告撰寫者和其單位所在部門。

2、目錄頁: 目錄頁將報告的各模塊呈現給讀者,方便閱讀和了解報告結構。

3、分析背景和項目說明: 用於闡述項目需求、分析目的、市場情況、以讓讀者了解項目的前因後果。項目說明用於註明假設、數據來源等。

4、分析思路頁: 這是整個報告的靈魂,便於理解報告的邏輯思路。

5、結論建議頁: 結論建議頁放在主題前,主要是為了給高層看時,結論建議可大幅度節省時間,簡明扼要。

6、分析主體頁面: 這里就要搬上你的各種數據表,數據分析圖。與表之間,圖與圖之間的聯系如何闡述,反映出的問題如何表達,這些都是在做數據分析圖表就要弄明白的。很多細心的領導及專門會針對你的數據分析以及結論來提問,因為現狀和未來是他們最關心的。所以你的數據展示一定要體現你的分析思路。

我曾經就被懟過一次,原因是數據分析結果展示於思路脫節,導致領導一直個為什麼,那個怎麼來,這個數據缺乏依據等等。因為當初的分析報告只是在展示數據,分析不透徹,表之間切換太過生硬,至今記憶猶新。後來,在做數據分析時,我製作一個表,或者一個圖,每個表或者圖都對不同維度做了深入的數據分析表,領導一問為什麼,我就點擊進去展示給他看明細,這用的就是FineBI的聯動鑽取和螺旋式分析功能,在展示時也能實時分析(以往的文章有提過)。

7、附錄頁:附錄頁目的是透明分析過程,常防止受訪者的基本資料。

報告的論述

一份好的報告,光有好的結構還不夠,還要有好的論述,關於論述,有幾個注意事項。

1、數據可靠,界定嚴謹

報告的數據來源一定要可靠。寫一份報告,獲取和整理數據往往會占據 6成以上的時間。要規劃數據協調相關部門組織數據採集、搭建體系平台、導出處理數據,最後才是寫報告,為了結論准確有效,你要保證數據的可靠性,否則一切都可能會變成誤導決策的努力。

界定是指報告中要對數據的來源、計算、概念做說明。不同的界定,有不同的結論。比如什麼是高端微波爐,不同的界定,得到的數據肯定是不同的。

2、概念一致,標准統一

一些名詞的解釋和定義,前後要一致,不要讓人不知所雲。

3、直觀呈報,通俗易懂

我們寫得報告還是金亮圖標話,用生動的圖表代替數字和文字的大量對切往往更形象直觀地理解你的.分析和結論。

一份完整的數據分析報告2

1、你要一個故事

我自己有個想法,就是產品經理應該多學習相關領域的知識,比如學一些基礎的設計規范、交互原則、營銷知識,心理學知識,演算法知識等等。除了一些明顯的對工作的幫助,也能幫助自己擴展思路。其實做好報告,就應向咨詢機構或者投資機構學習。

一個報告核心不是包含很多內容,讓聽眾或者讀者去花時間理解,核心是講好一個簡單的故事。咨詢和投資機構做BP之前,會先花時間理清楚storyline。其實各種報告都應該這樣,先理清楚你要講的故事。

2、一個數據分析報告的框架

這里列出一個我個人比較喜歡的報告框架,可能針對不同的報告場景需要有所調整(比如刪除部分步驟,或者增加部分細節):

項目背景:簡述項目相關背景,為什麼做,目的是什麼

項目進度:綜述項目的整體進程,以及目前的情況

名詞解釋:關鍵性指標定義是什麼,為什麼這么定義

數據獲取方法:如何取樣,怎麼獲取到的數據,會有哪些問題

數據概覽:重要指標的趨勢,變化情況,重要拐點成因解釋

數據拆分:根據需要拆分不同的維度,作為細節補充

結論匯總:匯總之前數據分析的主要結論,作為概覽

後續改進:分析目前存在的問題,並給出解決改進防範

致謝

附件:詳細數據

項目背景 & 項目進度

項目背景,需要簡述項目相關背景,為什麼做,目的是什麼。項目進度,需要綜述項目的整體進程,以及目前的情況。這兩點其實沒什麼可說的,如果對象是項目成員,可以寫簡單一些,如果對象是對項目不了解的人,則需要多寫 一些,但還是要盡量用最簡單的話,跟別人講明白。

名詞解釋 & 數據獲取方法

名詞解釋:關鍵性指標定義是什麼,為什麼這么定義。這點是很多人忽略的,其實很多時候數據的誤解都是因為對指標沒有統一的定義。舉例而言,點擊率可以是點擊次數/瀏覽次數,也可以是點擊人數/瀏覽人數。人數可能按訪問去重,也可能按天去重。如果沒有清晰的解釋,不同人理解不同,對整個數據的可讀性就大打折扣。

數據獲取方法:如何取樣,怎麼獲取到的數據,會有哪些問題。原始數據往往有一些缺憾,要經過數據清洗剔除雜訊,也需要部分假設進行數據補全。數據清洗和數據補全的方法需要跟匯報對象說明並且獲得認可,讓對方對於置信度有一個估計。

數據概覽 & 數據拆分

數據概覽,需要有重要指標的趨勢,變化情況,重要拐點成因解釋。

數據拆分,需要根據需要拆分不同的維度,作為細節補充。

這里基本上就是之前說的數據分析方法了。如果需要對方知道對比或者趨勢,則使用圖,如果需要對方知道具體數據,則使用表。表格對需要強調的數字要做明顯標識。需要注意的點是:核心指標要少而關鍵,拆分指標要有意義且詳細。同時如果是PPT的話,每頁說明白一個結論或者解釋清楚一個趨勢足以。關鍵性結論要用一句話能說清楚。

結論匯總 & 後續改進

結論匯總,基本是對之前數據分析階段的數據進行匯總,形成完整的結論。

後續改進,需要在數據分析的結論和問題的基礎上,對後續的迭代和改進措施作出方向性的說明。這部分其實很多時候也是分析的根本目的。

致謝 & 附件

致謝是對項目組合相關協助部門的致謝,基本上對於項目組和相關協助部門而言,也希望自己的工作或者積極配合能看到有效的數據結果。在之後的合作中,也會更加融洽。

附件是需要附贈更多沒有必要在數據報告中體現但是仍然有價值的數據。對於PPT而言,這部分也可以放在PPT致謝之後,與會同事有疑問,可以隨時翻到最後解釋。

3、總結

一個產品,如果你不能衡量它,你就不能了解它,自然而然,你就無法改進它。這是說數據。

而數據報告的意義也是類似,項目完成之後需要完整匯報,這樣無論是對上匯報還是對團隊而言,都是有重要意義。

突然想到一個事情。去年的時候做了一個內部數據平台,到了取名字的時候,我用了dice。為什麼叫dice呢?

這得從物理說起(開啟神棍模式)。物理學不斷前行,之前人們認為物理學是決定論的,只要知道系統的初始值和足夠細節,就能知道之後系統的演化路徑。後來發現不是這樣的,對於一個基本粒子而言,觀測之前,粒子狀態和位置是不可預測的。愛因斯坦說「上帝不會擲骰子」,然後後續的研究,更多的是支持上帝是擲骰子的。這也是dice的來源。

即使是上帝視角,也不可能知道提前知道數據的結果。那麼作為產品經理而言,尊重數據結果,並分析形成結論,遠比相信一些所謂的方法論的條條框框好得多。

一份完美的數據分析報告讓你高人一籌

企業需要發展就需要得到更多信息,這些信息需要有專業能力的人才提供給企業,而這就是數據分析師,數據分析師要通過專業的手段獲取信息,對信息做整合,分析信息,最終形成數據分析統計報告。

在數據分析師的全部工作流程中,數據分析統計報告作為工作的成果是對企業、以及項目的最終發展方向及目標的決策起到至關重要的依據。

在編寫一份完整的數據分析報告前,這些數據報告給誰看,首先你要知道你的這份報告要突出那些點,在做一個數據分析之前領導所關心的哪些點,圍繞著這些中心點,簡單明了的進行編寫數據報告。

數據報告不需要大批量的文字闡述,本身數據分析是圍繞數據為核開展相應的工作,數據報告要突出的也是最終的統計結果,以數字的方式進行簡單明了的闡述對比,報告中加入一些畫像模型,柱線圖、餅狀圖來表示佔有份額等等最為突出,讓閱覽者可以很好的理解,很容易在你的這份報告中找到自己企業在市場的份額,這是作為一個優秀的數據分析師的基本功。

先展示自己在行業內的情況後還要分析當前整個市場的數據變化走勢,通過對自身行業市場的大數據統計,找到市場發展新的切入點、客戶們所關心的新問題、潛在客戶的特徵最終形成走勢圖為企業提供發展方向。

哪些點是我們不足的地方,哪些是我們需要開展的新業務等等,這些都會從行業數據大趨勢發展中體現出來,從而為企業未來的發展決策提供參考依據,為企業領導提供新的信息點,幫助企業思考、創新、完善做出一份滿意的答卷。

㈢ 調研報告大數據分析怎麼做

1、明確思路


明確數據分析的目的以及思路是確保數據分析過程有效進行的首要條件。它作用的是可以為數據的收集、處理及分析提供清晰的指引方向。可以說思路是整個分析流程的起點。首先目的不明確則會導致方向性的錯誤。當明確目的後,就要建分析框架,把分析目的分解成若干個不同的分析要點,即如何具體開展數據分析,需要從哪幾個角度進行分析,採用哪些分析指標。


2、收集數據


收集數據是按照確定的數據分析框架收集相關數據的過程,它為數據分析提供了素材和依據。這里所說的數據包括第一手數據與第二手數據,第一手數據主要指可直接獲取的數據,第二手數據主要指經過加工整理後得到的數據。


3、處理數據


處理數據是指對收集到的數據進行加工整理,形成適合數據分析的樣式,它是數據分析前必不可少的階段。數據處理的基本目的是從大量的、雜亂無章、難以理解的數據中,抽取並推導出對解決問題有價值、有意義的數據。數據處理主要包括數據清洗、數據轉化、數據提取、數據計算等處理方法。


4、分析數據


分析數據是指用適當的分析方法及工具,對處理過的數據進行分析,提取有價值的信息,形成有效結論的過程。由於數據分析多是通過軟體來完成的,這就要求數據分析師不僅要掌握各種數據分析方法,還要熟悉數據分析軟體的操作。而數據挖掘其實是一種高級的數據分析方法,就是從大量的數據中挖掘出有用的信息,它是根據用戶的特定要求,從浩如煙海的數據中找出所需的信息,以滿足用戶的特定需求。


5、展現數據


一般情況下,數據是通過表格和圖形的方式來呈現的,我們常說用圖表說話就是這個意思。常用的數據圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖、雷達圖等,當然可以對這些圖表進一步整理加工,使之變為我們所需要的圖形。


6、撰寫報告


數據分析報告其實是對整個數據分析過程的一個總結與呈現。通過報告,把數據分析的起因、過程、結果及建議完整地呈現出來,供決策者參考。一份好的數據分析報告,首先需要有一個好的分析框架,並且圖文並茂,層次明晰,能夠讓閱讀者一目瞭然。另外,數據分析報告需要有明確的結論,沒有明確結論的分析稱不上分析,同時也失去了報告的意義,因為我們最初就是為尋找或者求證一個結論才進行分析的,所以千萬不要舍本求末。最後,好的分析報告一定要有建議或解決方案。

㈣ 如何建立數據分析的思維框架

曾經有人問過我,什麼是數據分析思維?如果分析思維是一種結構化的體現,那麼數據分析思維在它的基礎上再加一個准則:

不是我覺得,而是數據證明

這是一道分水嶺,「我覺得」是一種直覺化經驗化的思維,工作不可能處處依賴自己的直覺,公司發展更不可能依賴於此。數據證明則是數據分析的最直接體現,它依託於數據導向型的思維,而不是技巧,前者是指導,後者只是應用。

作為個人,應該如何建立數據分析思維呢?
丨建立你的指標體系
在我們談論指標之前,先將時間倒推幾十年,現代管理學之父彼得·德魯克說過一句很經典的話:

如果你不能衡量它,那麼你就不能有效增長它。

所謂衡量,就是需要統一標准來定義和評價業務。這個標准就是指標。假設隔壁老王開了一家水果鋪子,你問他每天生意怎麼樣,他可以回答賣的不錯,很好,最近不景氣。這些都是很虛的詞,因為他認為賣的不錯也許是賣了 50 個,而你認為的賣的不錯,是賣了 100 。

這就是「我覺得」造成的認知陷阱。將案例放到公司時,會遇到更多的問題:若有一位運營和你說,產品表現不錯,因為每天都有很多人評價和稱贊,還給你看了幾個截圖。而另外一位運營說,產品有些問題,推的活動商品賣的不好,你應該相信誰呢?

其實誰都很難相信,這些眾口異詞的判斷都是因為缺乏數據分析思維造成的。

老王想要描述生意,他應該使用銷量,這就是他的指標,互聯網想要描述產品,也應該使用活躍率、使用率、轉化率等指標。

如果你不能用指標描述業務,那麼你就不能有效增長它。

了解和使用指標是數據分析思維的第一步,接下來你需要建立指標體系,孤立的指標發揮不出數據的價值。和分析思維一樣,指標也能結構化,也應該用結構化。

我們看一下互聯網的產品,一個用戶從開始使用到離開,都會經歷這些環節步驟。電商APP還是內容平台,都是雷同的。想一想,你會需要用到哪些指標?

而下面這張圖,解釋了什麼是指標化,這就是有無數據分析思維的差異,也是典型的數據化運營,有空可以再深入講這塊。

指標體系沒有放之四海而皆準的模板,不同業務形態有不同的指標體系。移動 APP 和網站不一樣, SaaS 和電子商務不一樣,低頻消費和高頻消費不一樣。好比一款婚慶相關的 APP ,不需要考慮復購率指標;互聯網金融,必須要風控指標;電子商務,賣家和買家的指標各不一樣。

這些需要不同行業經驗和業務知識去學習掌握,那有沒有通用的技巧和注意事項呢?
丨好指標與壞指標
不是所有的指標都是好的。這是初出茅廬者常犯的錯誤。我們繼續回到老王的水果鋪子,來思考一下,銷量這個指標究竟是不是好的?

丨最近物價上漲,老王順應調高了水果價格,又不敢漲的提高,雖然水果銷量沒有大變化,但老王發現一個月下來沒賺多少,私房錢都不夠存。

丨老王這個月的各類水果銷量有 2000 ,但最後還是虧本了,仔細研究後發現,雖然銷量高,但是水果庫存也高,每個月都有幾百單位的水果滯銷最後過期虧本。

這兩個例子都能說明只看銷量是一件多不靠譜的事情。銷量是一個衡量指標,但不是好指標。老王這種個體經營戶,應該以水果鋪子的利潤為核心要素。

好指標應該是核心驅動指標。雖然指標很重要,但是有些指標需要更重要。就像銷量和利潤,用戶數和活躍用戶數,後者都比前者重要。

核心指標不只是寫在周報的數字,而是整個運營團隊、產品團隊乃至研發團隊都統一努力的目標。

核心驅動指標和公司發展關聯,是公司在一個階段內的重點方向。記住是一個階段,不同時期的核心驅動指標不一樣。不同業務的核心驅動指標也不一樣。

互聯網公司常見的核心指標是用戶數和活躍率,用戶數代表市場的體量和佔有,活躍率代表產品的健康度,但這是發展階段的核心指標。在產品 1.0 期間,我們應把注意力放到打磨產品上,在大推廣前提高產品質量,這時留存率是一個核心指標。而在有一定用戶基數的產品後期,商業化比活躍重要,我們會關注錢相關的指標,比如廣告點擊率、利潤率等。

核心驅動指標一般是公司整體的目標,若從個人的崗位職責看,也可以找到自己的核心指標。比如內容運營可以關注閱讀數和閱讀時長。

核心驅動指標一定能給公司和個人帶來最大優勢和利益,記得二八法則么?20%的指標一定能帶來 80% 的效果,這 20% 的指標就是核心。

另外一方面,好的指標還有一個特性,它應該是比率或者比例。

拿活躍用戶數說明就懂了,我們活躍用戶有 10 萬,這能說明什麼呢?這說明不了什麼。如果產品本身有千萬級別的注冊用戶,那麼 10 萬用戶說明非常不健康,產品在衰退期。如果產品只擁有四五十萬用戶,那麼說明產品的粘性很高。

正因為單純的活躍用戶數沒有多大意義,所以運營和產品會更關注活躍率。這個指標就是一個比率,將活躍用戶數除以總用戶數所得。所以在設立指標時,我們都盡量想它能不能是比率。

壞指標有哪些呢?

其一是虛榮指標,它沒有任何的實際意義。

產品在應用商店有幾十萬的曝光量,有意義嗎?沒有,我需要的是實際下載。下載了意義大嗎?也不大,我希望用戶注冊成功。曝光量和下載量都是虛榮指標,只是虛榮程度不一樣。

新媒體都追求微信公眾號閱讀數,如果靠閱讀數做廣告,那麼閱讀數有意義,如果靠圖文賣商品,那麼更應該關注轉化率和商品銷量,畢竟一個誇張的標題就能帶來很高的閱讀量,此時的閱讀量是虛榮指標。可惜很多老闆還是孜孜不倦的追求 10W+ ,哪怕刷量。

虛榮指標是沒有意義的指標,往往它會很好看,能夠粉飾運營和產品的工作績效,但我們要避免使用。

第二個壞指標是後驗性指標,它往往只能反應已經發生的事情。

比如我有一個流失用戶的定義:三個月沒有打開APP就算做流失。那麼運營每天統計的流失用戶數,都是很久沒有打開過的,以時效性看,已經發生很久了,也很難通過措施挽回。我知道曾經因為某個不好的運營手段傷害了用戶,可是還有用嗎?

活動運營的 ROI(投資回報率)也是後驗性指標,一個活動付出成本後才能知道其收益。可是成本已經支出,活動的好與壞也註定了。活動周期長,還能有調整餘地。活動短期的話,這指標只能用作復盤,但不能驅動業務。

第三個壞指標是復雜性指標,它將數據分析陷於一堆指標造成的陷阱中。

指標能細分和拆解,比如活躍率可以細分成日活躍率、周活躍率、月活躍率、老用戶活躍率等。數據分析應該根據具體的情況選擇指標,如果是天氣類工具,可以選擇日活躍率,如果是社交 APP ,可以選擇周活躍率,更低頻的產品則是月活躍率。

每個產品都有適合它的幾個指標,不要一股腦的裝一堆指標上去,當你准備了二三十個指標用於分析,會發現無從下手。
丨指標結構
既然指標太多太復雜不好,那麼應該如何正確的選擇指標呢?

和分析思維的金字塔結構一樣,指標也有固有結構,呈現樹狀。指標結構的構建核心是以業務流程為思路,以結構為導向。

假設你是內容運營,需要對現有的業務做一個分析,提高內容相關數據,你會怎麼做呢?

我們把金字塔思維轉換一下,就成了數據分析方法了。

從內容運營的流程開始,它是:內容收集—內容編輯發布—用戶瀏覽—用戶點擊—用戶閱讀—用戶評論或轉發—繼續下一篇瀏覽。

這是一個標準的流程,每個流程都有指標可以建立。內容收集可以建立熱點指數,看哪一篇內容比較火。用戶瀏覽用戶點擊則是標準的 PV 和 UV 統計,用戶閱讀是閱讀時長。

從流程的角度搭建指標框架,可以全面的囊括用戶相關數據,無有遺漏。

這套框架列舉的指標,依舊要遵循指標原則:需要有核心驅動指標。移除虛榮指標,適當的進行刪減,不要為添加指標而添加指標。
丨維度分析法
當你有了指標,可以著手進行分析,數據分析大體可以分三類,第一類是利用維度分析數據,第二類是使用統計學知識如數據分布假設檢驗,最後一類是使用機器學習。我們先了解一下維度分析法。

維度是描述對象的參數,在具體分析中,我們可以把它認為是分析事物的角度。銷量是一種角度、活躍率是一種角度,時間也是一種角度,所以它們都能算維度。

當我們有了維度後,就能夠通過不同的維度組合,形成數據模型。數據模型不是一個高深的概念,它就是一個數據立方體。

上圖就是三個維度組成的數據模型/數據立方體。分別是產品類型、時間、地區。我們既能獲得電子產品在上海地區的 2010 二季度的銷量,也能知道書籍在江蘇地區的 2010 一季度銷量。

數據模型將復雜的數據以結構化的形式有序的組織起來。我們之前談到的指標,都可以作為維度使用。下面是範例:

丨將用戶類型、活躍度、時間三個維度組合,觀察不同用戶群體在產品上的使用情況,是否A群體使用的時長更明顯?

丨將商品類型、訂單金額、地區三個維度組合,觀察不同地區的不同商品是否存在銷量差異?

數據模型可以從不同的角度和層面來觀察數據,這樣提高了分析的靈活性,滿足不同的分析需求、這個過程叫做 OLAP(聯機分析處理)。當然它涉及到更復雜的數據建模和數據倉庫等,我們不用詳細知道。

數據模型還有幾種常見的技巧、叫做鑽取、上卷、切片。

選取就是將維度繼續細分。比如浙江省細分成杭州市、溫州市、寧波市等, 2010 年一季度變成 1 月、 2 月、 3 月。上卷則是鑽取的相反概念,將維度聚合,比如浙江、上海、江蘇聚合成浙江滬維度。切片是選中特定的維度,比如只選上海維度、或者只選 2010 年一季度維度。因為數據立方體是多維的,但我們觀察和比較數據只能在二維、即表格中進行。

上圖的樹狀結構代表鑽取(source 和 time 的細分),然後通過對 Route 的 air 切片獲得具體數據。

聰明的你可能已經想到,我們常用的數據透視表就是一種維度分析,將需要分析的維度放到行列組合進行求和、計數、平均值等計算。放一張曾經用到的案例圖片:用城市維度和工作年限維度,計算平均工資。

除了 Excel 、BI 、R 、Python 都能用維度分析法。BI 是相對最簡便的。

談到維度法,想要強調的是分析的核心思維之一:對比,不同維度的對比,這大概是對新人快速提高的最佳捷徑之一。比如過去和現在的時間趨勢對比,比如不同地區維度的對比,比如產品類型的區別對比,比如不同用戶的群體對比。單一的數據沒有分析意義,只有多個數據組合才能發揮出數據的最大價值。

我想要分析公司的利潤,利潤 = 銷售額 - 成本。那麼找出銷售額涉及的指標/維度,比如產品類型、地區、用戶群體等,通過不斷的組合和拆解,找出有問題或者表現良好的原因。成本也是同理。

這就是正確的數據分析思維。總結一下吧:我們通過業務建立和篩選出指標,將指標作為維度,利用維度進行分析。

很多人會問,指標和維度有什麼區別?

維度是說明和觀察事物的角度,指標是衡量數據的標准。維度是一個更大的范圍,不只是數據,比如時間維度和城市維度,我們就無法用指標表示,而指標(留存率、跳出率、瀏覽時間等)卻可以成為維度。通俗理解:維度>指標。

到這里,大家已經有一個數據分析的思維框架了。之所以是框架,因為還缺少具體的技巧,比如如何驗證某一個維度是影響數據的關鍵,比如如何用機器學習提高業務,這些涉及到數據和統計學知識,以後再講解。

這里我想強調,數據分析並不是一個結果,只是過程。還記得「如果你不能衡量它,那麼你就不能有效增長它」這句話嗎?數據分析的最終目的就是增長業務。如果數據分析需要績效指標,一定不會是分析的對錯,而是最終數據提升的結果。

數據分析是需要反饋的,當我分析出某項要素左右業務結果,那麼就去驗證它。告訴運營和產品人員,看看改進後的數據怎麼樣,一切以結果為准。如果結果並沒有改善,那麼就應該反思分析過程了。

這也是數據分析的要素,結果作導向。分析若只是當一份報告呈現上去,後續沒有任何跟進、改進的措施,那麼數據分析等與零。

業務指導數據,數據驅動業務。這才是不二法門。
作者:秦路

㈤ 如何從一開始就設計好數據分析的基本框架

如何從一開始就設計好數據分析的基本框架

下面這篇文章中向我們講解創業者們如何可以從一開始就設計好數據分析的基本框架:將數據儲存於何處?用什麼工具分析最好?可以規避哪些常見的錯誤?以及,今天的你如何亡羊補牢?

關於數據分析,避免6個錯誤

1.走得太快,沒空回頭看路

初創公司里的人們彷彿一直在被人念著緊箍咒:「要麼快要麼死,要麼快要麼死。」他們是如此著急於產品開發,以至於他們常常沒有空想用戶對產品的具體使用細節,產品在哪些場景怎麼被使用,產品的哪些部分被使用,以及用戶回頭二次使用產品的原因主要有哪些。而這些問題如果沒有數據難以回答。

2.你沒有記錄足夠的數據

光給你的團隊看呈現總結出來的數據是沒有用的。如果沒有精確到日乃至小時的變化明細,你無法分析出來數據變化背後看不見的手。如果只是粗放的,斷續的統計,沒有人可以解讀出各種細微因素對於銷售或者用戶使用習慣的影響。

與此同時,數據儲存越來越便宜。同時做大量的分析也不是什麼高風險的事情,只要買足夠的空間就不會有system breakdown的風險。因此,記錄盡可能多的數據總不會是一件壞事。

不要害怕量大。對於初創企業來說,大數據其實還是比較少見的事情。如果正處於初創期的你果真(幸運地)有這樣的困擾,Porterfield(本文)推薦使用一個叫Hadoop的平台。

3.其實你的團隊成員常常感覺自己在盲人摸象

許多公司以為他們把數據扔給Mixpanel, Kissmetrics,或者Google Analytics就夠了,但他們常常忽略了團隊的哪些成員能真正解讀這些數據的內在含義。你需要經常提醒團隊裡面每一位成員多去理解這些數據,並更多地基於數據來做決策。要不然,你的產品團隊只會盲目地開發產品,並祈禱能踩中熱點,不管最終成功還是失敗了都是一頭霧水。

舉例:

有天你決定採用市場上常見的病毒營銷手段吸引新用戶。如你所願,用戶量啪啪啪地上來了。可此時你會遇到新的迷茫:你無法衡量這個營銷手段對老用戶的影響。人們可能被吸引眼球,注冊為新用戶,然後厭倦而不再使用。你可能為吸引了一幫沒有價值的用戶付出了過高的代價。而你的產品團隊可能還在沾沾自喜,認為這個損害產品的營銷手段是成功的。

這種傻錯誤經常發生。而如果你的企業在一開始就建立起人人可自助使用的數據平台,來解答他們工作中最重要的疑惑,則可以避免上文所說的悲劇。

4.把數據存放在不合適的地方

先讓我們來看一個正確示範吧。Porerfield提到他有個客戶整合了NoSQL, Redshift,Kitnesis以及Looker的資源自創了一個數據分析框架。這個框架不僅能在很高的量級上捕獲及儲存自己的數據,還能承受每月數以百萬計的點擊流量,還能讓所有人查詢自己想要的數據。這個系統甚至可以讓不懂SQL語言的小白用戶們真正理解數據的意義。而在數據分析的世界裡,基本上如果你不會SQL,你就完蛋了。如果總是要等待工程師去把數據跑出來,那就是把自己陷入困境。而工程師在不理解需求的情況下建立的演算法或者買的軟體對於使用者來說往往是個煎熬,因為他們對數據的使用往往與前者不再同一水平線上。

你需要讓你所有的數據都存放在同一個地方。這個是關鍵關鍵最關鍵的原則。
讓我們回到前文那個假設存在的公司。他們做了一個又一個病毒營銷,但是沒有把用戶活動數據放在同一框架內,所以他們無法分析一個活動是如何關聯到另一個活動的。他們也無法進行一個橫跨日常運營以及活動期間的數據分析比較。

很多公司把數據發給外包商儲存,然後就當甩手掌櫃了。可是常常這些數據到了外包商手裡就會變成其他形式,而轉化回來則需要不少工序。這些數據往往是某些宣傳造勢活動時期你的網站或者產品的相關數據。結合日常運營數據來看,你可以挖掘哪些活動促成了用戶轉化。而這樣結合日常運營數據來分析用戶使用歷程的方式是至關重要的。但令人震驚的是,盡管任何時期的所有運營數據都至關重要,許多公司仍不屑於捕獲及記錄他們。約一半以上Porterfield所見過的公司都將日常運營數據與活動數據分開來看。這樣嚴重妨礙了公司正確地理解與決策。

5.目光短淺

任何一個好的數據分析框架在設計之初都必須滿足長期使用的需要。誠然,你總是可以調整你的框架。但數據積累越多,做調整的代價越大。而且常常做出調整後,你需要同時記錄新舊兩套系統來確保數據不會丟失。

因此,我們最好能在第一天就把框架設計好。其中一個簡單粗暴有效地方法就是所有能獲取的數據放在同一個可延展的平台。不需要浪費時間選擇一個最優解決方法,只要確認這個平台可以裝得下所有將來可能用到的數據,且跨平台也能跑起來就行了。一般來說這樣的原始平台能至少支撐一到兩年。

6.過度總結

雖然說這個問題對於擁有大數據分析團隊的公司來說更常見,初創公司最好也能注意避免掉。試想一下,有多少公司只是記錄平均每分鍾多少銷售額,而不是具體每一分鍾銷售了多少金額?在過去由於運算能力有限,我們只能把海量數據總結成幾個點來看。但在當下,這些運算量根本不是問題,所有人都可以把運營數據精確到分鍾來記錄。而這些精確的記錄可以告訴你海量的信息,比如為什麼轉化率在上升或者下降。

人們常常自我陶醉於做出了幾張漂亮的圖標或者PPT。這些總結性的表達看上去很令人振奮,但我們不應該基於這些膚淺的總結來做決策,因為這些漂亮的總結性陳述並不能真正反映問題的實質。相反,我們更應該關注極端值(Outliers)。

3個簡單防護措施,幫你少走彎路

少犯錯誤遠比你想的重要,因為錯誤一旦發生,很容易耗費大量的工程時間和資源來彌補錯誤。如果不小心,你的工程師們可能花費昂貴的時間來為銷售團隊解碼數據,可能錯過無數寶貴的營銷機會。每當數據變得難使用或者理解時,你的團隊決策速度會變慢,因此你的生意進展必將受到拖累

好消息是,如果你從有用戶伊始就採用以下3個簡單的防護措施,你一定可以避免走很多彎路。

1.任命一個商業數據首席工程師

如果你能在團隊中找到一個隊數據分析真正有興趣的工程師,你可以讓他負責記錄管理所有數據。這將為整個團隊節省海量的時間。Porterfield分享到,在Looker,這樣的一個商業數據首席工程師負責寫能記錄所有數據的腳本,從而方便大家總是能在同一個資料庫內獲取需要的信息。事實證明,這是個簡單有效的方法,極大地提高了團隊的工作效率。

2.把數據放在開放的平台上

Porterfield強力推薦大家使用類似於Snowplow的開源平台,以能實時記錄所有與產品相關的活動事件數據。它使用方便,有好的技術支援,可以放量使用。而最棒的一點,它能與你其餘的數據框架很好的兼容。

3.盡快將你的數據遷移到AWS Redshift或者其它大規模並行處理資料庫(MPP)上

對於還處於早期的公司來說,類似於Redshift這種基於雲端的MPP經常就是最好的選擇。因為他們價格便宜,便於部署和管理,並且擴展性強。在理想狀況下,你會希望從公司有記錄之初就將你的事件與操作的數據寫入亞馬遜Redshift之中。「使用Redshift的好處在於這個平台便宜,迅速,可訪問性高,」Porterfield說。並且,對於那些已經使用AWS服務的人來說,它(使用redshift)可以無縫接入你已有的架構中。你可以很容易的建設一個數據通道把數據直接傳入這個系統中進行分析處理。「Redshift能讓你靈活的寫入巨量的顆粒狀的數據而並不根據事件觸發量的多少這樣難以估計的參數來收費,」他說。「其它的服務會根據你儲存事件的多少來收費,所以當越來越多的人使用你的產品時,越來越多的操作數據會被記錄下來,這會導致最終的收費像火箭一樣越升越高。」

如何用數據分析佔領市場先機?

數據分析的價值取決於它能如何幫助你佔領市場先機。作為初創公司,所有的數據應該被用於你對公司不同階段設立的目標上。

舉例

一個快遞公司通常會檢測平均送達每件貨物的時間。這看上去是很關鍵的數據,但如果沒有充分的上下文(畢竟收貨人可能在一個街區外,也可能在幾百公里外),這也是沒有意義的。另一個角度上,平均送貨時間也沒有收貨人的整體滿意度重要。因此,你必須確保你的分析囊括了正確的數據。

以上是小編為大家分享的關於如何從一開始就設計好數據分析的基本框架的相關內容,更多信息可以關注環球青藤分享更多干貨

㈥ 市場數據分析怎麼做

1.明確目的和思路


首先明白本次的目的,梳理分析思路,並搭建整體分析框架,把分析目的分解,化為若乾的點,清晰明了,即分析的目的,用戶什麼樣的,如何具體開展數據分析,需要從哪幾個角度進行分析,採用哪些分析指標(各類分析指標需合理搭配使用)。同時,確保分析框架的體系化和邏輯性。


2.數據收集


根據目的和需求,對數據分析的整體流程梳理,找到自己的數據源,進行數據分析,一般數據來源於四種方式:資料庫、第三方數據統計工具、專業的調研機構的統計年鑒或報告(如艾瑞資訊)、市場調查。


3.數據處理


數據收集就會有各種各樣的數據,有些是有效的有些是無用的,這時候我們就要根據目的,對數據進行處理,處理主要包括數據清洗、數據轉化、數據提取、數據計算等處理方法,將各種原始數據加工成為產品經理需要的直觀的可看數據。


4.數據分析


數據處理好之後,就要進行數據分析,數據分析是用適當的分析方法及工具,對處理過的數據進行分析,提取有價值的信息,形成有效結論的過程。


5.數據展現


一般情況下,數據是通過表格和圖形的方式來呈現的。常用的數據圖表包括餅圖、柱形圖、條形圖、折線圖、氣泡圖、散點圖、雷達圖等。進一步加工整理變成我們需要的圖形,如金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。


6.報告撰寫


撰寫報告一定要圖文結合,清晰明了,框架一定要清楚,能夠讓閱讀者讀懂才行。結構清晰、主次分明可以使閱讀者正確理解報告內容;圖文並茂,可以令數據更加生動活潑,提高視覺沖擊力,有助於閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。

㈦ 大數據分析方法,常用的哪些

數據分析的目的越明確,分析越有價值。明確目的後,需要梳理思路,搭建分析框架,把分析目的分解成若干個不同的分析要點,然後針對每個分析要點確定分析方法和具體分析指標;最後,確保分析框架的體系化(體系化,即先分析什麼,後分析什麼,使得各個分析點之間具有邏輯聯系),使分析結果具有說服力。

㈧ 現在有一批數據要進行分析,可以從哪些方面進行

可以從如下三個方面:現狀分析、原因分析、預測分析。
1.明確分析目的與思路:一切以解決業務問題為中心,依據分析目標明確思路,打開分析視角,使數據分析框架體系化。
2.數據收集與預處理:數據來源有Excel/CSV/SQL資料庫/NoSQL資料庫/Hive數據倉庫/外部數據,從數據來源收集數據後需要做清洗工作,包括缺失值、錯誤值、重復值、異常值等都要處理好,當然還有轉換、拆分、合並等等工作也可能要做,這樣才能滿足後續數據分析的要求。
3.數據分析與挖掘:使用各種數據分析方法與分析工具(如Excel/SQL/SPSS/SAS/Tableau/PowerBI/Python)進行分析挖掘。
4.數據可視化並生成報告:使用專業化圖表,也可以結合表格,最後以報告方式輸出數據分析成果。

㈨ 自學轉行數據分析類崗位需要掌握哪些知識框架

數據分析類崗位有兩個大的職業方向選擇:業務方向和技術方向。
業務方向的數據分析崗位可以從初級數據分析師入手,逐漸成長為業務負責人;而如果你更偏好技術性工作,那麼數據相關崗位中可以選擇數據挖掘工程師、大數據開發工程師、數據建模師。無論選擇哪一種崗位,數據分析能力都是對求職者最基礎的要求。正確規劃數據分析學習路徑從而自學,也要從數據分析能力入手,學習的內容包括但不限於數據分析思維、統計學知識、數據分析技術、數據建模能力以及可視化能力。
一、資料庫語言SQL
SQL語言作為一門編程語言,是數據分析師的必備能力,也是數據分析師必須要熟練掌握的基本功,可以作為數據分析的入門學習內容之一。對於SQL語言的編程基本特性,初學者們首先需要掌握基礎的查詢語句,從而進行復雜查詢的學習。學習期間,不要忘了穿插各類函數的使用,如聚合函數、數值函數等。基於不同資料庫,SQL語法可能會略有差異,但不會影響我們對基本功的掌握。
二、統計學基礎
統計學是數據分析的理論基礎,描述性統計以及各類統計圖表的使用也早已深入到數據分析師的工作日常。在數據分析師的工作場景中,日常的基礎原理便是統計學中的假設檢驗分析方法。此外,在後期的學習過程中,良好的統計學基礎也可以為機器學習內容做鋪墊。
三、機器學習
機器學習更多作為數據建模師和數據科學家的必要能力,在日常工作中常和語言混合應用,對數據及屬性進行預測和分類。對於初級數據分析師來說,機器學習知識並不是工作場景中的必要內容,但對於高級數據。分析師來說,掌握機器學習卻是必經之路。此外,在現階段數據分析的筆面試過程中,機器學習基礎知識往往作為必要考點出現。因此在機器學習階段,求職者們可以借用學習一些基礎的演算法。

㈩ 電商數據分析應該從哪些方面進行分析

從8個方面來闡述如何對電商平台進行數據分析:

1.總體運營指標:從流量、訂單、總體銷售業績、整體指標進行把控,起碼對運營的電商平台有個大致了解,到底運營的怎麼樣,是虧是賺。
2.網站流量指標:即對訪問你網站的訪客進行分析,基於這些數據可以對網頁進行改進,以及對訪客的行為進行分析等等。
3.銷售轉化指標:分析從下單到支付整個過程的數據,幫助你提升商品轉化率。也可以對一些頻繁異常的數據展開分析。
4.客戶價值指標:這里主要就是分析客戶的價值,可以建立RFM價值模型,找出那些有價值的客戶,精準營銷等等。
5.商品類指標:主要分析商品的種類,那些商品賣得好,庫存情況,以及可以建立關聯模型,分析那些商品同時銷售的幾率比較高,而進行捆綁銷售。
6.市場營銷活動指標,主要監控某次活動給電商網站帶來的效果,以及監控廣告的投放指標。
7.風控類指標:分析賣家評論,以及投訴情況,發現問題,改正問題。
8.市場競爭指標:主要分析市場份額以及網站排名,進一步進行調整

想要更精準的了解電商平台的數據分析,推薦咨詢情報通。情報通全面覆蓋國內外主流電商平台全類目電商數據,可進行多重屬性交叉分析,通過對不同屬性組合進行分析,指導生產、指導訂貨,指導制定廣告投放策略,應用嚴謹的方法,進行數據爬取、數據計算、數據整理,常規數據日級抓取,直播數據分鍾級抓取,每周進行數據更新,可以隨時登錄系統進行查看。

閱讀全文

與數據分析框架和方法詳解相關的資料

熱點內容
福建家用溯源燕窩的食用方法 瀏覽:70
國標中檢測菌落總數的檢測方法 瀏覽:940
ktm檢測方法 瀏覽:151
十合一正確使用方法 瀏覽:579
兩個薄膜水泵連接方法 瀏覽:54
郵件發送圖片方法 瀏覽:332
西瓜醬怎麼調制方法 瀏覽:706
蒸汽煙怎麼使用方法 瀏覽:143
肝鬱結最好的鍛煉方法 瀏覽:692
線雕的使用方法有哪些 瀏覽:349
嘴唇燙傷用什麼方法好的最快 瀏覽:650
電信卡手機充值方法 瀏覽:51
視頻賣貨方法 瀏覽:578
治療黃褐斑用什麼方法好 瀏覽:359
手機鈴音效卡頓的維修方法 瀏覽:790
研究動植物的辨認方法 瀏覽:901
用煮方法的菜的圖片 瀏覽:566
家電給手機充電方法 瀏覽:533
用什麼方法消滅皮膚蟎蟲 瀏覽:292
小攝像頭安裝方法 瀏覽:360