多元統計分析方法的作用使實際工作者利用多元統計分析方法解決實際問題更簡單方便。
如果每個個體有多個觀測數據,或者從數學上說,如果個體的觀測數據能表為P維歐幾里得空間的點,那麼這樣的數據叫做多元數據,而分析多元數據的統計方法就叫做多元統計分析,它是數理統計學中的一個重要的分支學科。
典型相關分析
它是尋求兩組變數各自的線性函數中相關系數達到最大值的一對,這稱為第一對典型變數,還可以求第二對,第三對,等等,這些成對的變數,彼此是不相關的。各對的相關系數稱為典型相關系數。通過這些典型變數所代表的實際含意,可以找到這兩組變數間的一些內在聯系。典型相關分析雖然30年代已經出現,但至今未能廣泛應用。
2. python可以做數據分析,好處是什麼呢怎麼學習
鏈接:https://pan..com/s/1FJZAznKSbwv-X52AM7uSfg
煉數成金:Python數據分析。Python是一種面向對象、直譯式計算機程序設計語言。也是一種功能強大而完善的通用型語言,已經具有十多年的發展歷史,成熟且穩定。Python 具有腳本語言中最豐富和強大的類庫,足以支持絕大多數日常應用。 Python語法簡捷而清晰,具有豐富和強大的類庫。它常被昵稱為膠水語言,它能夠很輕松的把用其他語言製作的各種模塊(尤其是C/C++)輕松地聯結在一起。
課程將從Python的基本使用方法開始,一步步講解,從ETL到各種數據分析方法的使用,並結合實例,讓學員能從中借鑒學習。
課程目錄:
Python基礎
Python的概覽——Python的基本介紹、安裝與基本語法、變數類型與運算符
了解Python流程式控制制——條件、循環語句與其他語句
常用函數——函數的定義與使用方法、主要內置函數的介紹
.....
3. 16種常用的數據分析方法-生存分析
探究變數之間的關系是數據挖掘中的一個基本分析內容,對於常規的離散型或者連續型變數,有很多的方法可以用於挖掘其中的關系,比如線性回歸,邏輯回歸等等。然而有一類數據非常的特殊,用回歸分析等常用手段出處理這類數據並不合適,這類數據就是生存數據。
常規數據在表示時,只需要一個值,比如患者的血壓,性別等數據,不是連續型就是離散型;生存數據則有兩個值,第一個是生存時間,可以看做是一個連續型的變數,第二個是生存事件,可以看做是離散型的變數。
比如分析治療後的患者生存情況,在觀測期間,可以看到不同患者的存活時間,這個值就是生存時間,而有些患者可能在觀察期內出現死亡,復發等情況,死亡或者復發則稱之為事件。
生存分析是既考慮結果又考慮生存時間的一種統計方法,並可充分利用截尾數據所提供的不完全信息,對生存時間的分布特徵進行描述,對影響生存時間的主要因素進行分析。
生存資料分析
生存分析就是針對生存資料的分析。所謂生存資料就是描述壽命或者一個發生時間的數據。更詳細的說一個人的生存時間的長短與許多因素有聯系的,研究因素與生存時間的聯系有無及程度大小,就是生存分析。
生存資料不同於其它分析資料,有一個特殊的地方就是缺失值的處理,對於常規數據,缺失值很多時可以直接丟掉,只有少量缺失值時可以用演算法進行填補,而生存數據中的缺失值則不同。
在觀測期間,患者可能出現了其他的事件導致後續得不到對應的生存數據,比如患者出現意外事故身亡了,後續的生存數據就會缺失,很顯然生存數據是不能用演算法填補的,一定要是實際觀測的結果。
但是這個數據也不能直接丟掉,因為從觀測開始到患者意外身亡的這段時間內的生存數據是有意義的,在進行生存分析時,這部分數據也可以利用起來。
應用場景
生存可以指人或動物的存活(相對於死亡),可以是患者的病情正處於緩解狀態(相對於再次復發或惡化),還可以是某個系統或產品正常工作(相對於失效或故障),甚至可是是客戶的流失與否等。
在生存分析中,研究的主要對象是壽命超過某一時間的概率。還可以描述其他一些事情發生的概率,例如產品的失效、出獄犯人第一次犯罪、失業人員第一次找到工作等等。
在某些領域的分析中,常常用追蹤的方式來研究事物的發展規律,比如研究某種葯物的療效,手術後的存活時間,某件機器的使用壽命等。
在醫學研究中,常常用追蹤的方式來研究事物發展的規律。如,了解某葯物的療效,了解手術的存活時間,了解某醫療儀器設備使用壽命等等。
生存分析主要內容
生存分析的主要內容包括:
l描述生存過程,即研究生存時間的分布規律
l比較生存過程,即研究兩組或多組生存時間的分布規律,並進行比較
l分析危險因素,即研究危險因素對生存過程的影響
l建立數學模型,即將生存時間與相關危險因素的依存關系用一個數學式子表示出來。
生存分析主要方法
生存分析方法可以分為描述法、參數法、半參數法和非參數法。
1.描述法
根據樣本觀測值提供的信息,直接用公式計算出每一個時間點或每一個時間區間上的生存函數、死亡函數、風險函數等,並採用列表或繪圖的形式顯示生存時間的分布規律。
優點:方法簡單且對數據分布無要求
缺點:不能比較兩組或多組生存時間分布函數的區別,不能分析危險因素,不能建立生存時間與危險因素之間的關系模型。
2.非參數法
估計生存函數時對生存時間的分布沒有要求,並且檢驗危險因素對生存時間的影響時採用的是非參數檢驗方法。
常用方法:乘積極限法、壽命表法
優點:可以估計生存函數,可以比較兩組或多組生存分布函數。可以分析危險因素對生存時間的影響,對生存時間的分布沒有要求。
缺點:不能建立生存時間與危險因素之間的關系模型。
3.參數法
根據樣本觀測值來估計假定的分布模型中的參數,獲得生存時間的概率分布模型。
生存時間經常服從的分布有:指數分布、Weibull分布、對數正態分布、對數Logistic分布、Gamma分布。
優點:可以估計生存函數,可以比較兩組或多組生存分布函數。可以分析危險因素對生存時間的影響,可以建立生存時間與危險因素之間的關系模型。
缺點:需要事先知道生存時間的分布
4.半參數法
不需要對生存時間的分布做出假定,但是卻可以通過一個模型來分析生存時間的分布規律,以及危險因素對生存時間的影響,最著名的就是COX回歸。
優點:可以估計生存函數,可以比較兩組或多組生存分布函數。可以分析危險因素對生存時間的影響,可以建立生存時間與危險因素之間的關系模型,不需要事先知道生存時間的分布。
生存分析案例
研究性別對於肺病生存率有無區別,收集數據下列信息
time:生存時間(單位天)
status:0=存活,1=死亡
sex:1=男,2=女
▋ 操作步驟
1)按步驟將數據導入
2)選定壽命表分析方法
3)對各選項進行設置
其中注意狀態設置:選取表示事件已發生的值
4)設置完所有選項後確認,得到結果
存活表:該表給出了男女對應時間內存活和死亡人數,並計算了存活率、風險比等統計量
中位數生存時間:即生存率為50%時,生存時間的平均水平;
由此可知:生存時間的平均水平女士高於男士
生存函數:男士較女士累計生存率下降快
4. 數據的分析涉及到的思想方法
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便採取適當行動。
數據分析的數學基礎在20世紀早期就已確立,但直到計算機的出現才使得實際操作成為可能,並使得數據分析得以推廣。數據分析是數學與計算機科學相結合的產物。
在統計學領域,有些人將數據分析劃分為描述性統計分析、探索性數據分析以及驗證性數據分析;其中,探索性數據分析側重於在數據之中發現新的特徵,而驗證性數據分析則側重於已有假設的證實或證偽。
探索性數據分析是指為了形成值得假設的檢驗而對數據進行分析的一種方法,是對傳統統計學假設檢驗手段的補充。該方法由美國著名統計學家約翰·圖基(John Tukey)命名。
定性數據分析又稱為「定性資料分析」、「定性研究」或者「質性研究資料分析」,是指對諸如詞語、照片、觀察結果之類的非數值型數據(或者說資料)的分析。
具體方法
數據分析有極廣泛的應用范圍。典型的數據分析可能包含以下三個步:
1、探索性數據分析:當數據剛取得時,可能雜亂無章,看不出規律,通過作圖、造表、用各種形式的方程擬合,計算某些特徵量等手段探索規律性的可能形式,即往什麼方向和用何種方式去尋找和揭示隱含在數據中的規律性。
2、模型選定分析,在探索性分析的基礎上提出一類或幾類可能的模型,然後通過進一步的分析從中挑選一定的模型。
3、推斷分析:通常使用數理統計方法對所定模型或估計的可靠程度和精確程度作出推斷。
分析方法
1、列表法
將實驗數據按一定規律用列表方式表達出來是記錄和處理實驗數據最常用的方法。表格的設計要求對應關系清楚、簡單明了、有利於發現相關量之間的物理關系;此外還要求在標題欄中註明物理量名稱、符號、數量級和單位等;根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。最後還要求寫明表格名稱、主要測量儀器的型號、量程和准確度等級、有關環境條件參數如溫度、濕度等。
2、作圖法
作圖法可以最醒目地表達物理量間的變化關系。從圖線上還可以簡便求出實驗需要的某些結果(如直線的斜率和截距值等),讀出沒有進行觀測的對應點(內插法)或在一定條件下從圖線的延伸部分讀到測量范圍以外的對應點(外推法)。此外,還可以把某些復雜的函數關系,通過一定的變換用直線圖表示出來。例如半導體熱敏電阻的電阻與溫度關系為,取對數後得到,若用半對數坐標紙,以lgR為縱軸,以1/T為橫軸畫圖,則為一條直線。
3、數據分析主要包含:
1. 簡單數學運算(Simple Math)
2. 統計(Statistics)
3. 快速傅里葉變換(FFT)
4. 平滑和濾波(Smoothing and Filtering)
5.基線和峰值分析(Baseline and Peak Analysis)
數據來源
1、搜索引擎蜘蛛抓取數據;
2、網站IP、PV等基本數據;
3、網站的HTTP響應時間數據;
4、網站流量來源數據。
數據分析過程的主要活動由識別信息需求、收集數據、分析數據、評價並改進數據分析的有效性組成。
識別需求
識別信息需求是確保數據分析過程有效性的首要條件,可以為收集數據、分析數據提供清晰的目標。識別信息需求是管理者的職責管理者應根據決策和過程式控制制的需求,提出對信息的需求。就過程式控制制而言,管理者應識別需求要利用那些信息支持評審過程輸入、過程輸出、資源配置的合理性、過程活動的優化方案和過程異常變異的發現。
收集數據
有目的的收集數據,是確保數據分析過程有效的基礎。組織需要對收集數據的內容、渠道、方法進行策劃。策劃時應考慮:
①將識別的需求轉化為具體的要求,如評價供方時,需要收集的數據可能包括其過程能力、測量系統不確定度等相關數據;
②明確由誰在何時何處,通過何種渠道和方法收集數據;
③記錄表應便於使用; ④採取有效措施,防止數據丟失和虛假數據對系統的干擾。
分析數據
分析數據是將收集的數據通過加工、整理和分析、使其轉化為信息,通常用方法有:
老七種工具,即排列圖、因果圖、分層法、調查表、散步圖、直方圖、控制圖;
新七種工具,即關聯圖、系統圖、矩陣圖、KJ法、計劃評審技術、PDPC法、矩陣數據圖;
過程改進
數據分析是質量管理體系的基礎。組織的管理者應在適當時,通過對以下問題的分析,評估其有效性:
①提供決策的信息是否充分、可信,是否存在因信息不足、失准、滯後而導致決策失誤的問題;
②信息對持續改進質量管理體系、過程、產品所發揮的作用是否與期望值一致,是否在產品實現過程中有效運用數據分析;
③收集數據的目的是否明確,收集的數據是否真實和充分,信息渠道是否暢通;
④數據分析方法是否合理,是否將風險控制在可接受的范圍;
⑤數據分析所需資源是否得到保障。
5. 想學習excel函數知識,功能太強大了,特別想知道函數的具體操作,有利於提高自己的工作效率!希望得到你的幫助
我空間里有一篇關於excel的文章,我給你傳過來:
1、編輯技巧
1 編輯技巧
(1) 分數的輸入
如果直接輸入「1/5」,系統會將其變為「1月5日」,解決辦法是:先輸入「0」,然後輸入空格,再輸入分數「1/5」。
(2) 序列「001」的輸入
如果直接輸入「001」,系統會自動判斷001為數據1,解決辦法是:首先輸入「'」(西文單引號),然後輸入「001」。
(3) 日期的輸入
如果要輸入「4月5日」,直接輸入「4/5」,再敲回車就行了。如果要輸入當前日期,按一下「Ctrl+;」鍵。
(4) 填充條紋
如果想在工作簿中加入漂亮的橫條紋,可以利用對齊方式中的填充功能。先在一單元格內填入「*」或「~」等符號,然後單擊此單元格,向右拖動滑鼠,選中橫向若干單元格,單擊「格式」菜單,選中「單元格」命令,在彈出的「單元格格式」菜單中,選擇「對齊」選項卡,在水平對齊下拉列表中選擇「填充」,單擊「確定」按鈕(如圖1)。
圖1
(5) 多張工作表中輸入相同的內容
幾個工作表中同一位置填入同一數據時,可以選中一張工作表,然後按住Ctrl鍵,再單擊窗口左下角的Sheet1、Sheet2......來直接選擇需要輸入相同內容的多個工作表,接著在其中的任意一個工作表中輸入這些相同的數據,此時這些數據會自動出現在選中的其它工作表之中。輸入完畢之後,再次按下鍵盤上的Ctrl鍵,然後使用滑鼠左鍵單擊所選擇的多個工作表,解除這些工作表的聯系,否則在一張表單中輸入的數據會接著出現在選中的其它工作表內。
(6) 不連續單元格填充同一數據
選中一個單元格,按住Ctrl鍵,用滑鼠單擊其他單元格,就將這些單元格全部都選中了。在編輯區中輸入數據,然後按住Ctrl鍵,同時敲一下回車,在所有選中的單元格中都出現了這一數據。
(7) 在單元格中顯示公式
如果工作表中的數據多數是由公式生成的,想要快速知道每個單元格中的公式形式,以便編輯修改,可以這樣做:用滑鼠左鍵單擊「工具」菜單,選取「選項」命令,出現「選項」對話框,單擊「視圖」選項卡,接著設置「窗口選項」欄下的「公式」項有效,單擊「確定」按鈕(如圖2)。這時每個單元格中的分工就顯示出來了。如果想恢復公式計算結果的顯示,就再設置「窗口選項」欄下的「公式」項失效即可。
圖2
(8) 利用Ctrl+*選取文本
如果一個工作表中有很多數據表格時,可以通過選定表格中某個單元格,然後按下Ctrl+*鍵可選定整個表格。Ctrl+*選定的區域為:根據選定單元格向四周輻射所涉及到的有數據單元格的最大區域。這樣我們可以方便准確地選取數據表格,並能有效避免使用拖動滑鼠方法選取較大單元格區域時屏幕的亂滾現象。
(9) 快速清除單元格的內容
如果要刪除內容的單元格中的內容和它的格式和批註,就不能簡單地應用選定該單元格,然後按Delete鍵的方法了。要徹底清除單元格,可用以下方法:選定想要清除的單元格或單元格範圍;單擊「編輯」菜單中「清除」項中的「全部」命令,這些單元格就恢復了本來面目。
2、單元格內容的合並
http://www.hongen.com/pc/oa/excel2k/ex2k1302.htm
根據需要,有時想把B列與C列的內容進行合並,如果行數較少,可以直接用「剪切」和「粘貼」來完成操作,但如果有幾萬行,就不能這樣辦了。
解決辦法是:在C行後插入一個空列(如果D列沒有內容,就直接在D列操作),在D1中輸入「=B1&C1」,D1列的內容就是B、C兩列的和了。選中D1單元格,用滑鼠指向單元格右下角的小方塊「■」,當游標變成"+"後,按住滑鼠拖動游標向下拖到要合並的結尾行處,就完成了B列和C列的合並。這時先不要忙著把B列和C列刪除,先要把D列的結果復制一下,再用「選擇性粘貼」命令,將數據粘貼到一個空列上。這時再刪掉B、C、D列的數據。
下面是一個「&」實際應用的例子。用AutoCAD繪圖時,有人喜歡在EXCEL中存儲坐標點,在繪制曲線時調用這些參數。存放數據格式為「x,y」的形式,首先在Excel中輸入坐標值,將x坐標值放入A列,y坐標值放入到B列,然後利用「&」將A列和B列合並成C列,在C1中輸入:=A1&","&B1,此時C1中的數據形式就符合要求了,再用滑鼠向下拖動C1單元格,完成對A列和B列的所有內容的合並(如圖3-4)。
合並不同單元格的內容,還有一種方法是利用CONCATENATE函數,此函數的作用是將若干文字串合並到一個字串中,具體操作為「=CONCATENATE(B1,C1)」。比如,假設在某一河流生態調查工作表中,B2包含「物種」、B3包含「河鱒魚」,B7包含總數45,那麼: 輸入「=CONCATENATE("本次河流生態調查結果:",B2,"",B3,"為",B7,"條/公里。")」 計算結果為:本次河流生態調查結果:河鱒魚物種為45條/公里。
圖3圖4
3、條件顯示
我們知道,利用If函數,可以實現按照條件顯示。一個常用的例子,就是教師在統計學生成績時,希望輸入60以下的分數時,能顯示為「不及格」;輸入60以上的分數時,顯示為「及格"。這樣的效果,利用IF函數可以很方便地實現。 假設成績在A2單元格中,判斷結果在A3單元格中。那麼在A3單元格中輸入公式: =if(A2<60,「不及格」,「及格」) 同時,在IF函數中還可以嵌套IF函數或其它函數。
例如,如果輸入: =if(A2<60,「不及格」,if(A2<=90,「及格」,「優秀")) 就把成績分成了三個等級。
如果輸入=if(A2<60,「差",if(A2<=70,「中」,if(A2<90,「良」,「優」))) 就把成績分為了四個等級。
再比如,公式: =if(SUM(A1:A5>0,SUM(A1:A5),0) 此式就利用了嵌套函數,意思是,當A1至A5的和大於0時,返回這個值,如果小於0,那麼就返回0。 還有一點要提醒你注意:以上的符號均為半形,而且IF與括弧之間也不能有空格。
4、自定義格式
Excel中預設了很多有用的數據格式,基本能夠滿足使用的要求,但對一些特殊的要求,如強調顯示某些重要數據或信息、設置顯示條件等,就要使用自定義格式功能來完成。 Excel的自定義格式使用下面的通用模型:正數格式,負數格式,零格式,文本格式,在這個通用模型中,包含三個數欄位和一個文本段:大於零的數據使用正數格式;小於零的數據使用負數格式;等於零的數據使用零格式;輸入單元格的正文使用文本格式。 我們還可以通過使用條件測試,添加描述文本和使用顏色來擴展自定義格式通用模型的應用。
(1)使用顏色 要在自定義格式的某個段中設置顏色,只需在該段中增加用方括弧括住的顏色名或顏色編號。Excel識別的顏色名為:[黑色]、[紅色]、[白色]、[藍色]、[綠色]、[青色]和[洋紅]。Excel也識別按[顏色X]指定的顏色,其中X是1至56之間的數字,代表56種顏色(如圖5)。
圖5
(2)添加描述文本 要在輸入數字數據之後自動添加文本,使用自定義格式為:"文本內容"@;要在輸入數字數據之前自動添加文本,使用自定義格式為:@"文本內容"。@符號的位置決定了Excel輸入的數字數據相對於添加文本的位置。
(3)創建條件格式 可以使用六種邏輯符號來設計一個條件格式:>(大於)、>=(大於等於)、<(小於)、<=(小於等於)、=(等於)、<>(不等於),如果你覺得這些符號不好記,就乾脆使用「>」或「>=」號來表示。
由於自定義格式中最多隻有3個數欄位,Excel規定最多隻能在前兩個數欄位中包括2個條件測試,滿足某個測試條件的數字使用相應段中指定的格式,其餘數字使用第3段格式。如果僅包含一個條件測試,則要根據不同的情況來具體分析。
自定義格式的通用模型相當於下式:[>;0]正數格式;[<;0]負數格式;零格式;文本格式。
下面給出一個例子:選中一列,然後單擊「格式」菜單中的「單元格」命令,在彈出的對話框中選擇「數字」選項卡,在「分類」列表中選擇「自定義」,然後在「類型」文本框中輸入「"正數:"($#,##0.00);"負數:"($ #,##0.00);"零";"文本:"@」,單擊「確定」按鈕,完成格式設置。這時如果我們輸入「12」,就會在單元格中顯示「正數:($12.00)」,如果輸入「-0.3」,就會在單元格中顯示「負數:($0.30)」,如果輸入「0」,就會在單元格中顯示「零」,如果輸入文本「this is a book」,就會在單元格中顯示「文本:this is a book」。 如果改變自定義格式的內容,「[紅色]"正數:"($#,##0.00);[藍色]"負數:"($ #,##0.00);[黃色]"零";"文本:"@」,那麼正數、負數、零將顯示為不同的顏色。如果輸入「[Blue];[Red];[Yellow];[Green]」,那麼正數、負數、零和文本將分別顯示上面的顏色(如圖6)。
圖6
再舉一個例子,假設正在進行帳目的結算,想要用藍色顯示結余超過$50,000的帳目,負數值用紅色顯示在括弧中,其餘的值用預設顏色顯示,可以創建如下的格式: 「[藍色][>50000] $#,##0.00_);[紅色][<0]( $#,##0.00); $#,##0.00_)」 使用條件運算符也可以作為縮放數值的強有力的輔助方式,例如,如果所在單位生產幾種產品,每個產品中只要幾克某化合物,而一天生產幾千個此產品,那麼在編制使用預算時,需要從克轉為千克、噸,這時可以定義下面的格式: 「[>999999]#,##0,,_m"噸"";[>999]##,_k_m"千克";#_k"克"」 可以看到,使用條件格式,千分符和均勻間隔指示符的組合,不用增加公式的數目就可以改進工作表的可讀性和效率。
另外,我們還可以運用自定義格式來達到隱藏輸入數據的目的,比如格式";##;0"只顯示負數和零,輸入的正數則不顯示;格式「;;;」則隱藏所有的輸入值。 自定義格式只改變數據的顯示外觀,並不改變數據的值,也就是說不影響數據的計算。靈活運用好自定義格式功能,將會給實際工作帶來很大的方便。
5、繪制函數圖象
做教學工作的朋友們一定會遇到畫函數曲線的問題吧!如果想快速准確地繪制一條函數曲線,可以藉助EXCEL的圖表功能,它能使你畫的曲線既標准又漂亮。你一定會問,是不是很難學呀?其實這一點兒也不難,可以說非常簡便,不信你就跟我試一試。
以繪制y=|lg(6+x^3)|的曲線為例,其方法如下: 在某張空白的工作表中,先輸入函數的自變數:在A列的A1格輸入"X=",表明這是自變數,再在A列的A2及以後的格內逐次從小到大輸入自變數的各個值;實際輸入的時候,通常應用等差數列輸入法,先輸入前二個值,定出自變數中數與數之間的步長,然後選中A2和A3兩個單元格,使這二項變成一個帶黑色邊框的矩形,再用滑鼠指向這黑色矩形的右下角的小方塊「■」,當游標變成"+"後,按住滑鼠拖動游標到適當的位置,就完成自變數的輸入。
輸入函數式:在B列的B1格輸入函數式的一般書面表達形式,y=|lg(6+x^3)|;在B2格輸入「=ABS(LOG10(6+A2^3))」,B2格內馬上得出了計算的結果。這時,再選中B2格,讓游標指向B2矩形右下角的「■」,當游標變成"+"時按住游標沿B列拖動到適當的位置即完成函數值的計算。
圖7
繪制曲線:點擊工具欄上的「圖表向導」按鈕,選擇「X,Y散點圖」(如圖7),然後在出現的「X,Y散點圖」類型中選擇「無數據點平滑線散點圖」;此時可察看即將繪制的函數圖像,發現並不是我們所要的函數曲線,單擊「下一步」按鈕,選中「數據產生在列」項,給出數據區域,這時曲線就在我們面前了(如圖8)。
圖8
需要注意:如何確定自變數的初始值,數據點之間的步長是多少,這是要根據函數的具體特點來判斷,這也是對使用者能力的檢驗。如果想很快查到函數的極值或看出其發展趨勢,給出的數據點也不一定非得是等差的,可以根據需要任意給定。
從簡單的三角函數到復雜的對數、指數函數,都可以用EXCEL畫出曲線。如果用得到,你還可以利用EXCEL來完成行列式、矩陣的各種計算,進行簡單的積分運算,利用迭代求函數值(如x^2=x^7+4,可用迭代方法求x值),等等,凡是涉及計算方面的事,找EXCEL來幫忙,它一定會給你一個滿意的答案。
6、自定義函數
雖然Excel中已有大量的內置函數,但有時可能還會碰到一些計算無函數可用的情況。假如某公司採用一個特殊的數學公式計算產品購買者的折扣,如果有一個函數來計算豈不更方便?下面就說一下如何創建這樣的自定義函數。
自定義函數,也叫用戶定義函數,是Excel最富有創意和吸引力的功能之一,下面我們在Visual Basic模塊中創建一個函數。 在下面的例子中,我們要給每個人的金額乘一個系數,如果是上班時的工作餐,就打六折;如果是加班時的工作餐,就打五折;如果是休息日來就餐,就打九折。首先打開「工具」菜單,單擊「宏」命令中的「Visual Basic編輯器」,進入Visual Basic編輯環境,在「工程-VBAobject」欄中的當前表上單擊滑鼠右鍵,選擇「插入」-「模塊」,在右邊欄創建下面的函數rrr,代碼如下: Function rrr(tatol, rr) If rr = "上班" Then rrr = 0.6 * tatol ElseIf rr = "加班" Then rrr = 0.5 * tatol ElseIf rr = "休息日" Then rrr = 0.9 * tatol End If End Function (如圖9)。
圖9
這時關閉編輯器,只要我們在相應的列中輸入rrr(F2,B2),那麼打完折後的金額就算出來了(如圖10)。
圖10
7、矩陣計算
Excel的強大計算功能,不但能夠進行簡單的四則運算,也可以進行數組、矩陣的計算。
(1)數組和矩陣的定義
矩陣不是一個數,而是一個數組。在Excel里,數組佔用一片單元域,單元域用大括弧表示,例如{A1:C3},以便和普通單元域A1:C3相區別。設置時先選定單元域,同時按Shift+Ctrl+Enter鍵,大括弧即自動產生,數組域得以確認。
一個單元格就是一個變數,一片單元域也可以視為一組變數。為了計算上的方便,一組變數最好給一個數組名。例如A={A1:C3}、B={E1:G3}等。數組名的設置步驟是:選定數組域,單擊「插入」菜單,選擇「名稱」項中的「定義」命令,輸入數組名,單擊「確定」按鈕即可。更簡單的命名辦法為:選擇數組域,單擊名稱框,直接輸入名稱就行了。
矩陣函數是Excel進行矩陣計算的專用模塊。用「插入」-「函數」命令打開「粘貼函數」對話框(如圖11),選中函數分類欄中的「數學與三角函數」,在右邊欄常用的矩陣函數有: MDETERM——計算一個矩陣的行列式; MINVERSE——計算一個矩陣的逆矩陣; MMULT——計算兩個矩陣的乘積; SUMPRODUCT——計算所有矩陣對應元素乘積之和。
圖11
(2)矩陣的基本計算
數組計算和矩陣計算有很大的區別,比如下面這個例子中,A和B都是定義好的數組,因為這兩個數組都是3×3的,輸出結果也是3×3個單元格。計算時先選定矩陣計算結果的輸出域,為3×3的單元格區域,然後輸入公式。如果輸入「=A+B」或「=A-B」,計算結果是數組對應項相加或相減,輸入「=A*B」表示數組A和B相乘,輸入「=A/B」表示數組A除數組B。如果要進行矩陣計算,就要用到相應的矩陣函數。矩陣相加、相減與數組的加減表達形式是一樣的,也是「=A+B」和「=A-B」,表示矩陣相乘可以輸入「=MMULT(A,B)」,而矩陣相除是矩陣A乘B的逆矩陣,所以計算公式是「=MMULT(A,MINVERSE(B))」。公式輸入後,同時按Shift+Ctrl+Enter鍵得到計算結果。 對於更復雜的矩陣計算,可以採用分步計算。
8、自動切換輸入法
在一張工作表中,往往是既有數據,又有文字,這樣在輸入時就需要來回在中英文之間反復切換輸入法,非常麻煩。 如果你要輸入的東西很有規律性,比如這一列全是單詞,下一列全是漢語解釋,你可以用以下方法實現自動切換。方法是:
(1)選中要輸入英文的列,單擊「數據」菜單,選擇「有效性...」命令,在彈出的「數據有效性」對話框中,選中「輸入法模式」選項卡,在「模式」框中選擇「關閉(英文模式)」命令,單擊「確定」按鈕(如圖12)。
圖12
(2)選中要輸入漢字的列,在「有效數據」對話框中,單擊「IME模式」選項卡,在「模式」框中選擇「打開」命令,單擊「確定」按鈕。這樣,當游標在前一列時,可以輸入英文,在下一列時,直接可以輸入中文,從而實現了中英文輸入方式之間的自動切換。
9、批量刪除空行
有時我們需要刪除Excel工作薄中的空行,一般做法是將空行一一找出,然後刪除。如果工作表的行數很多,這樣做就非常不方便。我們可以利用「自動篩選」功能,把空行全部找到,然後一次性刪除。 做法:先在表中插入新的一個空行,然後按下Ctrl+A鍵,選擇整個工作表,用滑鼠單擊「數據」菜單,選擇「篩選」項中的「自動篩選」命令。這時在每一列的頂部,都出現一個下拉列表框,在典型列的下拉列表框中選擇「空白」,直到頁面內已看不到數據為止(如圖13)。
圖13
在所有數據都被選中的情況下,單擊「編輯」菜單,選擇「刪除行」命令,然後按「確定」按鈕。這時所有的空行都已被刪去,再單擊「數據」菜單,選取「篩選」項中的「自動篩選」命令,工作表中的數據就全恢復了。插入一個空行是為了避免刪除第一行數據。
如果想只刪除某一列中的空白單元格,而其它列的數據和空白單元格都不受影響,可以先復制 此列,把它粘貼到空白工作表上,按上面的方法將空行全部刪掉,然後再將此列復制,粘貼到原工作表的相應位置上。
10、如何避免錯誤信息
在Excel中輸入公式後,有時不能正確地計算出結果,並在單元格內顯示一個錯誤信息,這些錯誤的產生,有的是因公式本身產生的,有的不是。下面就介紹一下幾種常見的錯誤信息,並提出避免出錯的辦法。
1)錯誤值:####
含義:輸入到單元格中的數據太長或單元格公式所產生的結果太大,使結果在單元格中顯示不下。或是日期和時間格式的單元格做減法,出現了負值。
解決辦法:增加列的寬度,使結果能夠完全顯示。如果是由日期或時間相減產生了負值引起的,可以改變單元格的格式,比如改為文本格式,結果為負的時間量。
2)錯誤值:#DIV/0!
含義:試圖除以0。這個錯誤的產生通常有下面幾種情況:除數為0、在公式中除數使用了空單元格或是包含零值單元格的單元格引用。
解決辦法:修改單元格引用,或者在用作除數的單元格中輸入不為零的值。
3)錯誤值:#VALUE!
含義:輸入引用文本項的數學公式。如果使用了不正確的參數或運算符,或者當執行自動更正公式功能時不能更正公式,都將產生錯誤信息#VALUE!。
解決辦法:這時應確認公式或函數所需的運算符或參數正確,並且公式引用的單元格中包含有效的數值。例如,單元格C4中有一個數字或邏輯值,而單元格D4包含文本,則在計算公式=C4+D4時,系統不能將文本轉換為正確的數據類型,因而返回錯誤值#VALUE!。
4)錯誤值:#REF!
含義:刪除了被公式引用的單元格範圍。
解決辦法:恢復被引用的單元格範圍,或是重新設定引用范圍。
5)錯誤值:#N/A
含義:無信息可用於所要執行的計算。在建立模型時,用戶可以在單元格中輸入#N/A,以表明正在等待數據。任何引用含有#N/A值的單元格都將返回#N/A。
解決辦法:在等待數據的單元格內填充上數據。
6)錯誤值:#NAME?
含義:在公式中使用了Excel所不能識別的文本,比如可能是輸錯了名稱,或是輸入了一個已刪除的名稱,如果沒有將文字串括在雙引號中,也會產生此錯誤值
解決辦法:如果是使用了不存在的名稱而產生這類錯誤,應確認使用的名稱確實存在;如果是名稱,函數名拼寫錯誤應就改正過來;將文字串括在雙引號中;確認公式中使用的所有區域引用都使用了冒號(:)。例如:SUM(C1:C10)。 注意將公式中的文本括在雙引號中。
7)錯誤值:#NUM! 含義:提供了無效的參數給工作表函數,或是公式的結果太大或太小而無法在工作表中表示。
解決辦法:確認函數中使用的參數類型正確。如果是公式結果太大或太小,就要修改公式,使其結果在-1×10307和1×10307之間。
8)錯誤值:#NULL! 含義:在公式中的兩個范圍之間插入一個空格以表示交叉點,但這兩個范圍沒有公共單元格。比如輸入:「=SUM(A1:A10 C1:C10)」,就會產生這種情況。
解決辦法: 取消兩個范圍之間的空格。上式可改為「=SUM(A1:A10 ,C1:C10)」
11、宏的應用
宏是一個指令集,用來告訴EXCEL來完成用戶指定的動作。宏類似於計算機程序,但是它是完全運行於EXCEL之中的,我們可以使用宏來完成枯燥的、頻繁的重復性工作。 宏完成動作的速度比用戶自己做要快得多。例如,我們可以創建一個宏,用來在工作表的每一行上輸入一組日期,並在每一單元格內居中對齊日期,然後對此行應用邊框格式。我們還可以創建一個宏,在「頁面設置」對話框中指定列印設置並列印文檔。
由於宏病毒的影響和對編程的畏懼心理,使很多人不敢用「宏」,或是不知道什麼時候可以找宏來幫忙。其實你盡管放心大膽地去用,如果只是用「錄制宏」的方法,根本就沒有什麼難的,只是把一些操作象用錄音機一樣錄下來,到用的時候,只要執行這個宏,系統就會把那操作再執行一遍。
下面給出了宏的應用場合,只要用「錄制宏」就可以幫你完成任務,而不需要編程。如果想對所錄制的宏再進行編輯,就要有一定的VBA知識了。
* 設定一個每個工作表中都需要的固定形式的表頭;
* 將單元格設置成一種有自己風格的形式;
* 每次列印都固定的頁面設置;
* 頻繁地或是重復地輸入某些固定的內容,比如排好格式的公司地址、人員名單等;
* 創建格式化表格;
* 插入工作表或工作薄等。
需要指出的是,EXCEL中的宏與WORD中的宏有些不同之處,對於錄制的操作,它會記住單元格的坐標(即所有的引用都是絕對的),所以在涉及到與位置有關的操作時,要格外注意。如果相用相對引用,可以藉助於Offset方法,比如下面的語句: ActiveCell.Offset(1,0). range("A1").select 宏的應用是很廣的,上面提到的只是一點點,如果真的用起來,你會發現它有更豐富的內容和更靈活的應用方法。
12、圖表的應用技巧
Excel提供了14種標準的圖表類型,每一種都具有多種組合和變換。在眾多的圖表類型中,選用那一種圖表更好呢? 根據數據的不同和使用要求的不同,可以選擇不同類型的圖表。圖表的選擇主要同數據的形式有關,其次才考慮感覺效果和美觀性。 下面給出了一些常見的規則。
面積圖:顯示一段時間內變動的幅值。當有幾個部分正在變動,而你對那些部分總和感興趣時,他們特別有用。面積圖使你看見單獨各部分的變動,同時也看到總體的變化。
條形圖:由一系列水平條組成。使得對於時間軸上的某一點,兩個或多個項目的相對尺寸具有可比性。比如:它可以比較每個季度、三種產品中任意一種的銷售數量。條形圖中的每一條在工作表上是一個單獨的數據點或數。因為它與柱形圖的行和列剛好是調過來了,所以有時可以互換使用。
柱形圖:由一系列垂直條組成,通常用來比較一段時間中兩個或多個項目的相對尺寸。例如:不同產品季度或年銷售量對比、在幾個項目中不同部門的經費分配情況、每年各類資料的數目等。條形圖是應用較廣的圖表類型,很多人用圖表都是從它開始的。
折線圖:被用來顯示一段時間內的趨勢。比如:數據在一段時間內是呈增長趨勢的,另一段時間內處於下降趨勢,我們可以通過折線圖,對將來作出預測。例如:速度-時間曲線、推力-耗油量曲線、升力系數-馬赫數曲線、 壓力-溫度曲線、疲勞強度-轉數曲線、轉輸功率代價-傳輸距離曲線等,都可以利用折線圖來表示,一般在工程上應用較多,若是其中一個數據有幾種情況,折線圖里就有幾條不同的線,比如五名運動員在萬米過程中的速度變化,就有五條折線,可以互相對比,也可以對添加趨勢線對速度進行預測。
股價圖:是具有三個數據序列的折線圖,被用來顯示一段給定時間內一種股標的最高價、最低價和收盤價。通過在最高、最低數據點之間畫線形成垂直線條,而軸上的小刻度代表收盤價。股價圖多用於金融、商貿等行業,用來描述商品價格、貨幣兌換率和溫度、壓力測量等,當然對股價進行描述是最拿手的了。
餅形圖:在用於對比幾個數據在其形成的總和中所佔百分比值時最有用。整個餅代表總和,每一個數用一個楔形或薄片代表。比如:表示不同產品的銷售量占總銷售量的百分比,各單位的經費占總經費的比例、收集的藏書中每一類佔多少等。餅形圖雖然只能表達一個數據列的情況,但因為表達得清楚明了,又易學好用,所以在實際工作中用得比較多。如果想多個系列的數據時,可以用環形圖。
6. 使用excel統計分析數據,想要什麼效果
數據分析比較常用到vlookup函數.當然也有其它的
一、用於求平均值的統計函數AVERAGE、TRIMMEAN
1、求參數的算術平均值函數AVERAGE
語法形式為AVERAGE(number1,number2, ...)
其中Number1, number2, ...為要計算平均值的 1~30 個參數。這些參數可以是數字,或者是涉及數字的名稱、數組或引用。如果數組或單元格引用參數中有文字、邏輯值或空單元格,則忽略其值。但是,如果單元格包含零值則計算在內。
2、求數據集的內部平均值TRIMMEAN
函數TRIMMEAN先從數據集的頭部和尾部除去一定百分比的數據點,然後再求平均值。當希望在分析中剔除一部分數據的計算時,可以使用此函數。比如,我們在計算選手平均分數中常用去掉一個最高分,去掉一個最低分,XX號選手的最後得分,就可以使用該函數來計算。
語法形式為TRIMMEAN(array,percent)
其中Array為需要進行篩選並求平均值的數組或數據區域。Percent為計算時所要除去的數據點的比例,例如,如果 percent = 0.2,在 20 個數據點的集合中,就要除去 4 個數據點(20 x 0.2),頭部除去 2 個,尾部除去 2 個。函數 TRIMMEAN 將除去的數據點數目向下舍為最接近的 2 的倍數。
3、舉例說明:示例中也列舉了帶A的函數AVERAGEA的求解方法。
求選手Annie的參賽分數。在這里,我們先假定已經將該選手的分數進行了從高到底的排序,在後面的介紹中我們將詳細了解排序的方法。
二、用於求單元格個數的統計函數COUNT
語法形式為COUNT(value1,value2, ...)
其中Value1, value2, ...為包含或引用各種類型數據的參數(1~30個),但只有數字類型的數據才被計數。函數 COUNT 在計數時,將把數字、空值、邏輯值、日期或以文字代表的數計算進去;但是錯誤值或其他無法轉化成數字的文字則被忽略。
如果參數是一個數組或引用,那麼只統計數組或引用中的數字;數組中或引用的空單元格、邏輯值、文字或錯誤值都將忽略。如果要統計邏輯值、文字或錯誤值,應當使用函數 COUNTA。
舉例說明COUNT函數的用途,示例中也列舉了帶A的函數COUNTA的用途。仍以上例為例,要計算一共有多少評委參與評分(用函數COUNTA),以及有幾個評委給出了有效分數(用函數COUNT)。
三、求區域中數據的頻率分布FREQUENCY
由於函數 FREQUENCY 返回一個數組,必須以數組公式的形式輸入。
語法形式為FREQUENCY(data_array,bins_array)
其中Data_array為一數組或對一組數值的引用,用來計算頻率。如果 data_array 中不包含任何數值,函數 FREQUENCY 返回零數組。Bins_array為一數組或對數組區域的引用,設定對 data_array 進行頻率計算的分段點。如果 bins_array 中不包含任何數值,函數 FREQUENCY 返回 data_array 元素的數目。
看起來FREQUENCY的用法蠻復雜的,但其用處很大。比如可以計算不同工資段的人員分布,公司員工的年齡分布,學生成績的分布情況等。這里以具體示例說明其基本的用法。
以計算某公司的員工年齡分布情況為例說明。在工作表裡列出了員工的年齡。這些年齡為 28、25、31、21、44、33、22 和 35,並分別輸入到單元格 C4:C11。這一列年齡就是 data_array。Bins_array 是另一列用來對年齡分組的區間值。在本例中,bins_array 是指 C13:C16 單元格,分別含有值 25、30、35、和 40。以數組形式輸入函數 FREQUENCY,就可以計算出年齡在 25歲以下、26~30歲、31~35歲、36~40歲和40歲以上各區間中的數目。本例中選擇了5個垂直相鄰的單元格後,即以數組公式輸入下面的公式。返回的數組中的元素個數比 bins_array(數組)中的元素個數多 1。第五個數字1表示大於最高間隔 (40) 的數值(44)的個數。函數 FREQUENCY 忽略空白單元格和文本值。
{=FREQUENCY(C4:C11,C13:C16)}等於 {2;2;2;1;1}
四、一組用於求數據集的滿足不同要求的數值的函數
1、求數據集的最大值MAX與最小值MIN
這兩個函數MAX、MIN就是用來求解數據集的極值(即最大值、最小值)。函數的用法非常簡單。語法形式為 函數(number1,number2,...),其中Number1,number2,... 為需要找出最大數值的 1 到 30 個數值。如果要計算數組或引用中的空白單元格、邏輯值或文本將被忽略。因此如果邏輯值和文本不能忽略,請使用帶A的函數MAXA或者MINA 來代替。
2、求數據集中第K個最大值LARGE與第k個最小值SMALL
這兩個函數LARGE、SMALL與MAX、MIN非常想像,區別在於它們返回的不是極值,而是第K個值。語法形式為:函數(array,k),其中Array為需要找到第 k 個最小值的數組或數字型數據區域。K為返回的數據在數組或數據區域里的位置(如果是LARGE為從大到小排,若為SMALL函數則從小到大排)。
3、 求數據集中的中位數MEDIAN
MEDIAN函數返回給定數值集合的中位數。所謂中位數是指在一組數據中居於中間的數,換句話說,在這組數據中,有一半的數據比它大,有一半的數據比它小。
語法形式為MEDIAN(number1,number2, ...)其中Number1, number2,...是需要找出中位數的 1 到 30 個數字參數。如果數組或引用參數中包含有文字、邏輯值或空白單元格,則忽略這些值,但是其值為零的單元格會計算在內。
4、 求數據集中出現頻率最多的數MODE
MODE函數用來返回在某一數組或數據區域中出現頻率最多的數值。跟 MEDIAN 一樣,MODE 也是一個位置測量函數。
語法形式為MODE(number1,number2, ...)其中Number1, number2, ... 是用於眾數(眾數指在一組數值中出現頻率最高的數值)計算的 1 到 30 個參數,也可以使用單一數組(即對數組區域的引用)來代替由逗號分隔的參數。
5、 以上函數的示例
以某單位年終獎金分配表為例說明。在示例中,我們將利用這些函數求解該單位年終獎金分配中的最高金額、最低金額、平均金額、中間金額、眾數金額以及第二高金額等。
詳細的公式寫法可從圖中清楚的看出,在此不再贅述。
五、用來排位的函數RANK、PERCENTRANK
1、一個數值在一組數值中的排位的函數RANK
數值的排位是與數據清單中其他數值的相對大小,當然如果數據清單已經排過序了,則數值的排位就是它當前的位置。數據清單的排序可以使用Excel提供的排序功能完成。
語法形式為RANK(number,ref,order) 其中Number為需要找到排位的數字;Ref 為包含一組數字的數組或引用。Order為一數字用來指明排位的方式。
如果 order 為 0 或省略,則Excel 將 ref 當作按降序排列的數據清單進行排位。
如果 order 不為零,Microsoft Excel 將 ref 當作按升序排列的數據清單進行排位。
需要說明的是,函數 RANK 對重復數的排位相同。但重復數的存在將影響後續數值的排位。
2、求特定數值在一個數據集中的百分比排位的函數PERCENTRANK
此PERCENTRANK函數可用於查看特定數據在數據集中所處的位置。例如,可以使用函數 PERCENTRANK 計算某個特定的能力測試得分在所有的能力測試得分中的位置。
語法形式為PERCENTRANK(array,x,significance) 其中Array為彼此間相對位置確定的數字數組或數字區域。X為數組中需要得到其排位的值。Significance為可選項,表示返回的百分數值的有效位數。如果省略,函數 PERCENTRANK 保留 3 位小數。
3、與排名有關的示例
仍以某單位的年終獎金分配為例說明,這里以員工Annie的排名為例說明公式的寫法。
獎金排名的公式寫法為:
=RANK(C3,$C$3:$C$12)
百分比排名的公式寫法為:
=PERCENTRANK($C$3:$C$12,C3)
以上我們介紹了Excel統計函數中比較常用的幾種函數,更多的涉及專業領域的統計函數可以參看附表以及各種相關的統計學書籍。
附表:
函數名稱 函數說明 語法形式
AVEDEV 返回一組數據與其均值的絕對偏差的平均值,即離散度。 AVEDEV(number1,number2, ...)
AVERAGE 返回參數算術平均值。 AVERAGE(number1,number2, ...)
AVERAGEA 計算參數清單中數值的平均值(算數平均值)。不僅數字,而且文本和邏輯值(如TRUE 和 FALSE)也將計算在內。 AVERAGEA(value1,value2,...)
BETADIST 返回 Beta 分布累積函數的函數值。Beta 分布累積函數通常用於研究樣本集合中某些事物的發生和變化情況。 BETADIST(x,alpha,beta,A,B)
BETAINV 返回 beta 分布累積函數的逆函數值。即,如果 probability = BETADIST(x,...),則 BETAINV(probability,...) = x。beta 分布累積函數可用於項目設計,在給定期望的完成時間和變化參數後,模擬可能的完成時間。 BETAINV(probability,alpha,beta,A,B)
BINOMDIST 返回一元二項式分布的概率值。 BINOMDIST(number_s,trials,probability_s,cumulative)
CHIDIST 返回 γ2 分布的單尾概率。γ2 分布與 γ2 檢驗相關。使用 γ2 檢驗可以比較觀察值和期望值。 CHIDIST(x,degrees_freedom)
CHIINV 返回 γ2 分布單尾概率的逆函數。 CHIINV(probability,degrees_freedom)
CHITEST 返回獨立性檢驗值。函數 CHITEST 返回 γ2 分布的統計值及相應的自由度。 CHITEST(actual_range,expected_range)
CONFIDENCE 返回總體平均值的置信區間。置信區間是樣本平均值任意一側的區域。 CONFIDENCE(alpha,standard_dev,size)
CORREL 返回單元格區域 array1 和 array2 之間的相關系數。使用相關系數可以確定兩種屬性之間的關系。 CORREL(array1,array2)
COUNT 返回參數的個數。利用函數 COUNT 可以計算數組或單元格區域中數字項的個數。 COUNT(value1,value2, ...)
COUNTA 返回參數組中非空值的數目。利用函數COUNTA 可以計算數組或單元格區域中數據項的個數。 COUNTA(value1,value2, ...)
COVAR 返回協方差,即每對數據點的偏差乘積的平均數,利用協方差可以決定兩個數據集之間的關系。 COVAR(array1,array2)
CRITBINOM 返回使累積二項式分布大於等於臨界值的最小值。此函數可以用於質量檢驗。 CRITBINOM(trials,probability_s,alpha)
DEVSQ 返回數據點與各自樣本均值偏差的平方和。 DEVSQ(number1,number2,...)
EXPONDIST 返回指數分布。使用函數 EXPONDIST 可以建立事件之間的時間間隔模型。 EXPONDIST(x,lambda,cumulative)
FDIST 返回 F 概率分布。使用此函數可以確定兩個數據系列是否存在變化程度上的不同。 FDIST(x,degrees_freedom1,degrees_freedom2)
FINV 返回 F 概率分布的逆函數值。 FINV(probability,degrees_freedom1,degrees_freedom2)
FISHER 返回點 x 的 Fisher 變換。該變換生成一個近似正態分布而非偏斜的函數。 FISHER(x)
FISHERINV 返回 Fisher 變換的逆函數值。使用此變換可以分析數據區域或數組之間的相關性。 FISHERINV(y)
FORECAST 根據給定的數據計算或預測未來值。 FORECAST(x,known_y's,known_x's)
FREQUENCY 以一列垂直數組返回某個區域中數據的頻率分布。 FREQUENCY(data_array,bins_array)
FTEST 返回 F 檢驗的結果。F 檢驗返回的是當數組 1 和數組 2 的方差無明顯差異時的單尾概率。可以使用此函數來判斷兩個樣本的方差是否不同。 FTEST(array1,array2)
GAMMADIST 返回伽瑪分布。可以使用此函數來研究具有偏態分布的變數。伽瑪分布通常用於排隊分析。 GAMMADIST(x,alpha,beta,cumulative)
GAMMAINV 返回伽瑪分布的累積函數的逆函數。 GAMMAINV(probability,alpha,beta)
GAMMALN 返回伽瑪函數的自然對數,Γ(x)。 GAMMALN(x)
GEOMEAN 返回正數數組或數據區域的幾何平均值。 GEOMEAN(number1,number2, ...)
GROWTH 根據給定的數據預測指數增長值。 GROWTH(known_y's,known_x's,new_x's,const)
HARMEAN 返回數據集合的調和平均值。調和平均值與倒數的算術平均值互為倒數。 HARMEAN(number1,number2, ...)
HYPGEOMDIST 返回超幾何分布。 HYPGEOMDIST(sample_s,number_sample,
population_s,number_population)
INTERCEPT 利用已知的 x 值與 y 值計算直線與 y 軸的截距。 INTERCEPT(known_y's,known_x's)
KURT 返回數據集的峰值。 KURT(number1,number2, ...)
LARGE 返回數據集里第 k 個最大值。使用此函數可以根據相對標准來選擇數值。 LARGE(array,k)
LINEST 使用最小二乘法計算對已知數據進行最佳直線擬合,並返回描述此直線的數組。 LINEST(known_y's,known_x's,const,stats)
LOGEST 在回歸分析中,計算最符合觀測數據組的指數回歸擬合曲線,並返回描述該曲線的數組。 LOGEST(known_y's,known_x's,const,stats)
LOGINV 返回 x 的對數正態分布累積函數的逆函數。 LOGINV(probability,mean,standard_dev)
LOGNORMDIST 返回 x 的對數正態分布的累積函數。 LOGNORMDIST(x,mean,standard_dev)
MAX 返回數據集中的最大數值。 MAX(number1,number2,...)
MAXA 返回參數清單中的最大數值。 MAXA(value1,value2,...)
MEDIAN 返回給定數值集合的中位數。中位數是在一組數據中居於中間的數。 MEDIAN(number1,number2, ...)
MIN 返回給定參數表中的最小值。 MIN(number1,number2, ...)
MINA 返回參數清單中的最小數值。 MINA(value1,value2,...)
MODE 返回在某一數組或數據區域中出現頻率最多的數值。 MODE(number1,number2, ...)
NEGBINOMDIST 返回負二項式分布。 NEGBINOMDIST(number_f,number_s,probability_s)
NORMDIST 返回給定平均值和標准偏差的正態分布的累積函數。 NORMDIST(x,mean,standard_dev,cumulative)
NORMINV 返回給定平均值和標准偏差的正態分布的累積函數的逆函數。 NORMINV(probability,mean,standard_dev)
NORMSDIST 返回標准正態分布的累積函數,該分布的平均值為 0,標准偏差為 1。 NORMSDIST(z)
NORMSINV 返回標准正態分布累積函數的逆函數。該分布的平均值為 0,標准偏差為 1。 NORMSINV(probability)
PEARSON 返回 Pearson(皮爾生)乘積矩相關系數,r,這是一個范圍在 -1.0 到 1.0 之間(包括 -1.0 和 1.0 在內)的無量綱指數,反映了兩個數據集合之間的線性相關程度。 PEARSON(array1,array2)
PERCENTILE 返回數值區域的 K 百分比數值點。可以使用此函數來建立接受閥值。例如,可以確定得分排名在 90 個百分點以上的檢測侯選人。 PERCENTILE(array,k)
PERCENTRANK 返回特定數值在一個數據集中的百分比排位。此函數可用於查看特定數據在數據集中所處的位置。例如,可以使用函數 PERCENTRANK 計算某個特定的能力測試得分在所有的能力測試得分中的位置。 PERCENTRANK(array,x,significance)
PERMUT 返回從給定數目的對象集合中選取的若干對象的排列數。排列可以為有內部順序的對象或為事件的任意集合或子集。排列與組合不同,組合的內部順序無意義。此函數可用於彩票計算中的概率。 PERMUT(number,number_chosen)
POISSON 返回泊松分布。泊松分布通常用於預測一段時間內事件發生的次數,比如一分鍾內通過收費站的轎車的數量。 POISSON(x,mean,cumulative)
PROB 返回一概率事件組中落在指定區域內的事件所對應的概率之和。如果沒有給出 upper_limit,則返回 x _range 內值等於 lower_limit 的概率。 PROB(x_range,prob_range,lower_limit,upper_limit)
QUARTILE 返回數據集的四分位數。四分位數通常用於在銷售額和測量值數據集中對總體進行分組。例如,可以使用函數 QUARTILE 求得總體中前 25% 的收入值。 QUARTILE(array,quart)
RANK 返回一個數值在一組數值中的排位。數值的排位是與數據清單中其他數值的相對大小(如果數據清單已經排過序了,則數值的排位就是它當前的位置)。 RANK(number,ref,order)
RSQ 返回根據 known_y's 和 known_x's 中數據點計算得出的 Pearson 乘積矩相關系數的平方。有關詳細信息,請參閱函數 REARSON。R 平方值可以解釋為 y 方差與 x 方差的比例。 RSQ(known_y's,known_x's)
SKEW 返回分布的偏斜度。偏斜度反映以平均值為中心的分布的不對稱程度。正偏斜度表示不對稱邊的分布更趨向正值。負偏斜度表示不對稱邊的分布更趨向負值。 SKEW(number1,number2,...)
SLOPE 返回根據 known_y's 和 known_x's 中的數據點擬合的線性回歸直線的斜率。斜率為直線上任意兩點的重直距離與水平距離的比值,也就是回歸直線的變化率。 SLOPE(known_y's,known_x's)
SMALL 返回數據集中第 k 個最小值。使用此函數可以返回數據集中特定位置上的數值。 SMALL(array,k)
STANDARDIZE 返回以 mean 為平均值,以 standard-dev 為標准偏差的分布的正態化數值。 STANDARDIZE(x,mean,standard_dev)
STDEV 估算樣本的標准偏差。標准偏差反映相對於平均值(mean)的離散程度。 STDEV(number1,number2,...)
STDEVA 估算基於給定樣本的標准偏差。標准偏差反映數值相對於平均值(mean)的離散程度。文本值和邏輯值(如 TRUE 或 FALSE)也將計算在內。 STDEVA(value1,value2,...)
STDEVP 返回以參數形式給出的整個樣本總體的標准偏差。標准偏差反映相對於平均值(mean)的離散程度。 STDEVP(number1,number2,...)
STDEVPA 計算樣本總體的標准偏差。標准偏差反映數值相對於平均值(mean)的離散程度。 STDEVPA(value1,value2,...)
STEYX 返回通過線性回歸法計算 y 預測值時所產生的標准誤差。標准誤差用來度量根據單個 x 變數計算出的 y 預測值的誤差量。 STEYX(known_y's,known_x's)
TDIST 返回學生 t- 分布的百分點(概率),t 分布中數值 (x) 是 t 的計算值(將計算其百分點)。t 分布用於小樣本數據集合的假設檢驗。使用此函數可以代替 t 分布的臨界值表。 TDIST(x,degrees_freedom,tails)
TINV 返回作為概率和自由度函數的學生 t 分布的 t 值。 TINV(probability,degrees_freedom)
TREND 返回一條線性回歸擬合線的一組縱坐標值(y 值)。即找到適合給定的數組 known_y's 和 known_x's 的直線(用最小二乘法),並返回指定數組 new_x's 值在直線上對應的 y 值。 TREND(known_y's,known_x's,new_x's,const)
TRIMMEAN 返回數據集的內部平均值。函數 TRIMMEAN 先從數據集的頭部和尾部除去一定百分比的數據點,然後再求平均值。當希望在分析中剔除一部分數據的計算時,可以使用此函數。 TRIMMEAN(array,percent)
TTEST 返回與學生氏- t 檢驗相關的概率。可以使用函數 TTEST 判斷兩個樣本是否可能來自兩個具有相同均值的總體。 TTEST(array1,array2,tails,type)
VAR 估算樣本方差。 VAR(number1,number2,...)
VARA 估算基於給定樣本的方差。不僅數字,文本值和邏輯值(如 TRUE 和 FALSE)也將計算在內。 VARA(value1,value2,...)
VARP 計算樣本總體的方差。 VARP(number1,number2,...)
VARPA 計算樣本總體的方差。不僅數字,文本值和邏輯值(如 TRUE 和 FALSE)也將計算在內。 VARPA(value1,value2,...)
WEIBULL 返回韋伯分布。使用此函數可以進行可靠性分析,比如計算設備的平均故障時間。 WEIBULL(x,alpha,beta,cumulative)
ZTEST 返回 z 檢驗的雙尾 P 值。Z 檢驗根據數據集或數組生成 x 的標准得分,並返回正態分布的雙尾概率。可以使用此函數返回從某總體中抽取特定觀測值的似然估計。