Ⅰ 平均值的標准差和樣本的標准差之間的關系式,是怎麼得到的
平均數設為x,所以平方差(標准差的平方)就是{(x1-x)的平方+(x2-x)的平方+(xn-x)的平方}總和除以n啦等於sx的平方。
對於樣本的數據,標准差^2=方差=各數據與x'之差的和再除以n-1,也就是[(x1-x')^2+(x2-x')^2+...+(xn-x')^2]/(n-1)。
對於總體的數據,標准差^2=方差=各數據與x'之差的和再除以n,也就是[(x1-x')^2+(x2-x')^2+...+(xn-x')^2]/n。
實際上
樣本方差可以理解成是對所給總體方差的一個無偏估計。E(S^2)=DX。
n-1的使用稱為貝塞爾校正,也用於樣本協方差和樣本標准偏差(方差平方根)。 平方根是一個凹函數,因此引入負偏差(由Jensen不等式),這取決於分布,因此校正樣本標准偏差(使用貝塞爾校正)有偏差。 標准偏差的無偏估計是技術上的問題,對於使用術語n-1.5的正態分布,形成無偏估計。
Ⅱ 知道總體平均數和標准差 怎麼求樣本
標准差(Standard Deviation) ,中文環境中又常稱均方差,但不同於均方誤差(mean squared error,均方誤差是各數據偏離真實值的距離平方的平均數,也即誤差平方和的平均數,計算公式形式上接近方差,它的開方叫均方根誤差,均方根誤差才和標准差形式上接近),標准差是離均差平方和平均後的方根,用σ表示。標准差是方差的算術平方根。標准差能反映一個數據集的離散程度。平均數相同的,標准差未必相同。
首先求出平均數x'。
對於樣本的數據,標准差^2=方差=各數據與x'之差的和再除以n-1,也就是[(x1-x')^2+(x2-x')^2++(xn-x')^2]/(n-1)
對於總體的數據,標准差^2=方差=各數據與x'之差的和再除以n,也就是[(x1-x')^2+(x2-x')^2++(xn-x')^2]/n
Ⅲ 平均值怎麼算
計算平均值,一般常用的有兩種方法:一種是簡單平均法,一種是加權平均法。
例如,某企業生產A產品10台,單價100元;生產B產品5台,單價50元;生產C產品3台,單價30元,計算平均價格?
簡單平均法:平均價格=∑各類產品單價 / 產品種類
平均價格=(100+50+30)/ 3 = 60(元)
加權平均法:平均價格=∑(產品單價×產品數量)/ ∑(產品數量)
平均價格=(100×10+50×5+30×3)/(10+5+3)= 74.44(元)
可以看出,簡單平均與加權平均計算出來的平均值差距較大,而後者更貼近事實,屬於精確計算。
(3)母本平均值和樣本計算方法擴展閱讀:
平均值有算術平均值,幾何平均值,平方平均值(均方根平均值,rms),調和平均值,加權平均值等。其中以算術平均值最為常見。
算術平均數,又稱均值,是統計學中最基本、最常用的一種平均指標,分為簡單算術平均數、加權算術平均數。它主要適用於數值型數據,不適用於品質數據。根據表現形式的不同,算術平均數有不同的計算形式和計算公式。
算術平均數是加權平均數的一種特殊形式(特殊在各項的權重相等)。在實際問題中,當各項權重不相等時,計算平均數時就要採用加權平均數;當各項權相等時,計算平均數就要採用算術平均數。
1. 加權算術平均數同時受到兩個因素的影響,一個是各組數值的大小,另一個是各組分布頻數的多少。在數值不變的情況下,一組的頻數越多,該組的數值對平均數的作用就大,反之,越小。
頻數在加權算術平均數中起著權衡輕重的作用,這也是加權算術平均數「加權」的含義。
2. 算術平均數易受極端值的影響。例如有下列資料:5、7、5、4、6、7、8、5、4、7、8、6、20,全部資料的平均值是7.1,實際上大部分數據(有10個)不超過7,如果去掉20,則剩下的12個數的平均數為6。
由此可見,極端值的出現,會使平均數的真實性受到干擾。
幾何平均數是對各變數值的連乘積開項數次方根。求幾何平均數的方法叫做幾何平均法。如果總水平、總成果等於所有階段、所有環節水平、成果的連乘積總和時,求各階段、各環節的一般水平、一般成果,要使用幾何平均法計算幾何平均數,而不能使用算術平均法計算算術平均數。
根據所拿握資料的形式不同,其分為簡單幾何平均數和加權幾何平均數兩種形式。
Ⅳ 母本平均值和樣本平均值的區別
樣本均值恰好等於母體(總體)均值的機會很少
一般情況下樣本均值與母體(總體)均值之間會有些差異,
樣本只是母體(總體)的一部分,不可能完全相等.
樣本取自母體(總體),所以可以反映其特徵,平均值也會比較接近.
隨機取有代表性的個體叫樣本
母體是總數,因較多所以取部分樣本來對母體也就是全體就行研究
Ⅳ 樣本均值公式是什麼
樣本平均數的計算公式是:設樣本平均數為x拔,樣本中數據有n個,則x拔=(x1+x2+....+xn)/n。樣本平均數是從一個或多個隨機變數上的數據集合(樣本)計算的統計量。
樣本平均值是總體平均值的估計量,其中總體是指採集樣本的集合,是統計比較常用的一種平均數演算法。
影響因素
1、可接受的抽樣風險可接受的抽樣風險與樣本規模成反比,注冊會計師願意接受的抽樣風險越低,樣本規模越大。
2、可容忍誤差
(1)控制測試中,是注冊會計師能夠接受的最大偏差數量,如果偏差超過這一數量則減少或取消對內部控製程序的信賴。
(2)細節測試中,它指注冊會計師確定的認定層次的重要性水平,可容忍誤差越小,為實現同樣的保證程度所需的樣本規模越大。
Ⅵ 怎樣求樣本平均值
平均值?假定有 n 個樣本,相應數值分別為:
x1、x2、x3、 ... xn
其平均數值為:x0 = (x1 + x2 + x3 + ... + xn)/n
Ⅶ 樣本平均值和總體平均值什麼區別什麼關系
一、樣本平均值與總體平均值的區別
1、定義不同
樣本均值是指在總體中的樣本數據的均值。而總體均值又稱為總體的數學期望或簡稱期望,是描述隨機變數取值平均狀況的數字特徵。包括離散型隨機變數的總體均值和連續型隨機變數的總體均值。
2、計算依據不同
樣本均值的計算依據是樣本個數,總體均值的計算依據是總體的個數。一般情況下樣本個數小於等於總體個數。
3、代表意義不同
樣本均值代表著所抽取的樣本的集中趨勢,而總體均值代表著全體個體的集中趨勢。樣本來自總體,但是樣本只是總體的一部分,兩者不可能完全相等,一般有差異。
二、樣本平均值與總體平均值的關系
1、計算思路相同:兩個均值的計算思路都是用所測量的群體的某指標的總和除以群體個數。
2、反映的都是數據的集中趨勢。樣本均值和總體均值都是反映數據集中趨勢的一項指標。
3、兩者一般情況下不完全相等,樣本是對總體的推測。
樣本只是總體的一部分,樣本取自總體,可以反映總體的特徵,因此樣本平均值也會比較接近於總體平均值,恰好等於總體平均值的機會很少。一般情況下樣本均值與總體均值之間會有些差異。
Ⅷ 樣本量的計算公式
(1)重復抽樣方式下:n為樣本容量、d為抽樣誤差范圍、σ為標准差,一般取0.5。
變數總體重復抽樣計算公式:
(8)母本平均值和樣本計算方法擴展閱讀
合理確定樣本容量的意義:
1、樣本容量過大,會增加調查工作量,造成人力、物力、財力、時間的浪費;
2、樣本容量過小,則樣本對總體缺乏足夠的代表性,從而難以保證推算結果的精確度和可靠性;
3、樣本容量確定的科學合理,一方面,可以在既定的調查費用下,使抽樣誤差盡可能小,以保證推算的精確度和可靠性;另一方面,可以在既定的精確度和可靠性下,使調查費用盡可能少,保證抽樣推斷的最大效果。
Ⅸ 樣本平均數怎麼求
在統計中經常用到平均數。如果求出的平均數是由所研究對象全部數據求出的,就叫做總體平均數;如果是由樣本求出的,就叫做樣本平均數。
假定有 n 個樣本,相應數值分別為:x1、x2、x3、 ... xn
其平均數值為:x0 = (x1 + x2 + x3 + ... + xn)/n
例如:解:平均數=(7.5*4+22.5*12+37.5*8+52.5*8+67.5*4+82.5*4)/(4+12+8+8+4+4)=(30+270+300+420+270+330)/40=40.5
差異
對於每個隨機變數,樣本平均數是人口平均值的一個很好的估計量,其中「良好」估計量被定義為有效和無偏差。 當然,由於從同一分布中抽取的不同樣本將給出不同的樣本平均數,因此對真實均值的估計不同,估計量可能不是群體平均值的真實值。 因此,樣本平均數是隨機變數,而不是常數,因此具有其自身的分布。 對於第j個隨機變數的N個觀察值的隨機抽樣。
以上內容參考:網路-樣本平均數
Ⅹ 二項分布的樣本均值和方差怎麼計算
LZ對公式和矩估計理解有誤啊,矩估計原理認為樣本的n階中心鉅和n階原點矩和總體的n階中心鉅和n階原點矩相同,也就是說,可以假設你測試的這一共400次的實驗,所求得的均值可以代表整個母體數據的均值,你測了400次,平均值是0.4375,那麼可以理解為不論測試多少次,拋硬幣的平均值就是0.4375;
所以你的公式算錯了:p=400p/n=400*0.4375/n=不論測試多少次出現正面的次數情況,這個裡面的n不是400 是任意數量,因為你用400求出的概率就等於任意實驗次數求出的概率,我們假設他們是近似的,幾乎一樣的,這個實驗方法就是矩估計原理,這樣說可能比較清楚
樣本的n肯定小於母體總量N 我所說的n隨機也是在N范圍內的,所以原題是讓你求置信區間.
可能是我講的還不太清楚,導致LZ誤解了,矩估計其實就是你通過樣本測試對母體情況的一種猜測,這種猜測的前提是我們假設樣本的情況是近似於母體的情況的,打個比方你投擲硬幣100次得到了一個平均值,這個平均值是可以代表投擲1000次產生的平均值,因為我們假設這兩個值是近似的,LZ太執泥於公式了,對公式沒有吃透啊.
正如LZ舉的例子,產品的總數N我們不知道,我們就可以隨機抽取n個樣本進行測試,把測試結果假設定義為所有產品的特徵,因為我們假設樣本具有母體特徵,兩個值是近似的,這就是我們為什麼不用測試所有產品,只要測試部分產品的原理,不知道這樣解釋LZ是否能理解:)
說個更簡單的例子 其實矩估計就是在一個大長方型未知的情況下,通過已知的一個同比例縮小的小長方型,求大長方型長和寬比例的方法.這樣講比較直觀.