『壹』 常用的數據分析工具有哪些
數據分析軟體有很多種,每一種都適合不同類型的人員。 簡單說: Excel:普遍適用,既有基礎,又有中高級。中級一般用Excel透視表,高級的用Excel VBA。 hihidata:比較小眾的數據分析工具。三分鍾就可以學會直接上手。
『貳』 如何用spss進行數據分析
錄入完數據後,你可以先進行基礎的數據統計--描述性統計。然後根據你的數據結果再看是否需要相關回歸或者其他分析。spss裡面的描述統計主要在analyze——descriptive裡面,其中有描述統計、頻數統計、交叉分析。 描述性統計分析是統計分析的第一步,先選擇analyze,你就能看到descriptive,然後滑鼠再選Descriptive 菜單中,最常用的是列在最前面的四個過程:Frequencies過程的特色是產生頻數表;Descriptives過程則進行一般性的統計描述;Explore過程用於對數據概況不清時的探索性分析;Crosstabs過程則完成計數資料和等級資料的統計描述和一般的統計檢驗。 先選擇analyze,---再選descriptive 打開任意的分析窗口後,你把想分析的數據選入,可以一起按滑鼠左鍵選中按中間按鈕加入,然後選擇單擊後彈出Statistics對話框,用於定義需要計算的其他描述統計量。你可以分析均數(Mean)、中位數(Median)、眾數(Mode)、總和(Sum)等等。 然後還可以點Charts對話框,選擇直方圖、餅圖等來繪圖。都確定好後,選擇單擊Continue鈕 ,然後選擇OK。就可以了。直接就會有輸出結果。 你可以先看看描述性統計的結果,有沒有什麼缺失值或者不符合實際的數據出現。要是有,你需要糾正數據,再用描述統計進行分析。 我覺得說的挺詳細的了。呵呵~~~~
『叄』 大數據分析工具有哪些,有什麼特點
常用的數據分析工具有如下幾個
SAS
一般用法。SAS由於其功能強大而且可以編程,很受高級用戶的歡迎。也正是基於此,它是最難掌握的軟體之一。使用SAS時,你需要編寫SAS程序來處理數據,進行分析。如果在一個程序中出現一個錯誤,找到並改正這個錯誤將是困難的。
數據管理。在數據管理方面,SAS是非常強大的,能讓你用任何可能的方式來處理你的數據。它包含SQL(結構化查詢語言)過程,可以在SAS數據集中使用SQL查詢。但是要學習並掌握SAS軟體的數據管理需要很長的時間,在Stata或SPSS中,完成許多復雜數據管理工作所使用的命令要簡單的多。然而,SAS可以同時處理多個數據文件,使這項工作變得容易。它可以處理的變數能夠達到32,768個,以及你的硬碟空間所允許的最大數量的記錄條數。
統計分析。SAS能夠進行大多數統計分析(回歸分析,logistic回歸,生存分析,方差分析,因子分析,多變數分析)。SAS的最優之處可能在於它的方差分析,混合模型分析和多變數分析,而它的劣勢主要是有序和多元logistic回歸(因為這些命令很難),以及穩健方法(它難以完成穩健回歸和其他穩健方法)。盡管支持調查數據的分析,但與Stata比較仍然是相當有限的。
繪圖功能。在所有的統計軟體中,SAS有最強大的繪圖工具,由SAS/Graph模塊提供。然而,SAS/Graph模塊的學習也是非常專業而復雜,圖形的製作主要使用程序語言。SAS 8雖然可以通過點擊滑鼠來互動式的繪圖,但不象SPSS那樣簡單。
總結。SAS適合高級用戶使用。它的學習過程是艱苦的,最初的階段會使人灰心喪氣。然而它還是以強大的數據管理和同時處理大批數據文件的功能,得到高級用戶的青睞。
Stata
一般用法。Stata以其簡單易懂和功能強大受到初學者和高級用戶的普遍歡迎。使用時可以每次只輸入一個命令(適合初學者),也可以通過一個Stata程序一次輸入多個命令(適合高級用戶)。這樣的話,即使發生錯誤,也較容易找出並加以修改。
數據管理。盡管Stata的數據管理能力沒有SAS那麼強大,它仍然有很多功能較強且簡單的數據管理命令,能夠讓復雜的操作變得容易。Stata主要用於每次對一個數據文件進行操作,難以同時處理多個文件。隨著Stata/SE的推出,現在一個Stata數據文件中的變數可以達到32,768,但是當一個數據文件超越計算機內存所允許的范圍時,你可能無法分析它。
統計分析。Stata也能夠進行大多數統計分析(回歸分析,logistic回歸,生存分析,方差分析,因子分析,以及一些多變數分析)。Stata最大的優勢可能在於回歸分析(它包含易於使用的回歸分析特徵工具),logistic回歸(附加有解釋logistic回歸結果的程序,易用於有序和多元logistic回歸)。Stata也有一系列很好的穩健方法,包括穩健回歸,穩健標准誤的回歸,以及其他包含穩健標准誤估計的命令。此外,在調查數據分析領域,Stata有著明顯優勢,能提供回歸分析,logistic回歸,泊松回歸,概率回歸等的調查數據分析。它的不足之處在於方差分析和傳統的多變數方法(多變數方差分析,判別分析等)。
繪圖功能。正如SPSS,Stata能提供一些命令或滑鼠點擊的交互界面來繪圖。與SPSS不同的是它沒有圖形編輯器。在三種軟體中,它的繪圖命令的句法是最簡單的,功能卻最強大。圖形質量也很好,可以達到出版的要求。另外,這些圖形很好的發揮了補充統計分析的功能,例如,許多命令可以簡化回歸判別過程中散點圖的製作。
總結。Stata較好地實現了使用簡便和功能強大兩者的結合。盡管其簡單易學,它在數據管理和許多前沿統計方法中的功能還是非常強大的。用戶可以很容易的下載到別人已有的程序,也可以自己去編寫,並使之與Stata緊密結合。
SPSS
一般用法。SPSS非常容易使用,故最為初學者所接受。它有一個可以點擊的交互界面,能夠使用下拉菜單來選擇所需要執行的命令。它也有一個通過拷貝和粘貼的方法來學習其「句法」語言,但是這些句法通常非常復雜而且不是很直觀。
數據管理。SPSS有一個類似於Excel的界面友好的數據編輯器,可以用來輸入和定義數據(缺失值,數值標簽等等)。它不是功能很強的數據管理工具(盡管SPS 11版增加了一些增大數據文件的命令,其效果有限)。SPSS也主要用於對一個文件進行操作,難以勝任同時處理多個文件。它的數據文件有4096個變數,記錄的數量則是由你的磁碟空間來限定。
統計分析。SPSS也能夠進行大多數統計分析(回歸分析,logistic回歸,生存分析,方差分析,因子分析,多變數分析)。它的優勢在於方差分析(SPSS能完成多種特殊效應的檢驗)和多變數分析(多元方差分析,因子分析,判別分析等),SPSS11.5版還新增了混合模型分析的功能。其缺點是沒有穩健方法(無法完成穩健回歸或得到穩健標准誤),缺乏調查數據分析(SPSS12版增加了完成部分過程的模塊)。
繪圖功能。SPSS繪圖的交互界面非常簡單,一旦你繪出圖形,你可以根據需要通過點擊來修改。這種圖形質量極佳,還能粘貼到其他文件中(Word 文檔或Powerpoint等)。SPSS也有用於繪圖的編程語句,但是無法產生交互界面作圖的一些效果。這種語句比Stata語句難,但比SAS語句簡單(功能稍遜)。
總結。SPSS致力於簡便易行(其口號是「真正統計,確實簡單」),並且取得了成功。但是如果你是高級用戶,隨著時間推移你會對它喪失興趣。SPSS是制圖方面的強手,由於缺少穩健和調查的方法,處理前沿的統計過程是其弱項。
總體評價
每個軟體都有其獨到之處,也難免有其軟肋所在。總的來說,SAS,Stata和SPSS是能夠用於多種統計分析的一組工具。通過Stat/Transfer可以在數秒或數分鍾內實現不同數據文件的轉換。因此,可以根據你所處理問題的性質來選擇不同的軟體。舉例來說,如果你想通過混合模型來進行分析,你可以選擇SAS;進行logistic回歸則選擇Stata;若是要進行方差分析,最佳的選擇當然是SPSS。假如你經常從事統計分析,強烈建議您把上述軟體收集到你的工具包以便於數據處理。
『肆』 浣犳墍鐭ラ亾鐨勭敤浜庢祦寮忔暟鎹鍒嗘瀽鐨勮蔣浠舵湁鍝浜涳紵
Spark Streaming錛孲torm錛孎link