1. 統計學問題:計算置信區間!!急急急!!!要具體步驟啊!!謝謝了啊!!!
該題目應該是總體成數的區間估計問題
解凱族答: 已知n=200,p=140/200=0.7,又已知1-α=0.95,則根據t分布表,與置信水平95%相對應的
t=2.14
於是△p= t * 根號下 p(1-p)/n=2.14 * 根號下0.7*0.3/200=6.93%
所以,由於這種原因離開該企業的人員的真正比例構造95%的置信區間為:
p-△p<=p<=p+△p
即:70%-6.93%<=p<=70%+6.93%
也即:63.07%<=p<=76.93%
故由於這種原因離開該企業的人員的搭孫豎真正比例構造95%的置信區間為(63.07%,76.93%)
因為統計公式符號不方便打上,開根號的地方我用漢字代替了
希望對你有幫助!知大
2. 統計推斷(區間估計)
一、置信區間的估計
1.統計推斷:統計推斷是基於樣本統計量對總體參數給出統計學結論
2.常用方法:置信區間估計和假設檢驗
3.95%置信度的含義: 100次抽樣結果的100個95%置信區間中,平均而言有95個置信區間包含了真實的總體均數。置信度常用C表示
二、置信區間
(1)已知σ時μ的置信區間
1.樣本量為n的簡單隨機抽樣數據,估計總體均數μ的置信區間,當總體分布服從正態分布時,樣本均數μ服從
2.對於一個觀察到的樣本,μ的置信度為C的置信區間為 ,其中 為μ的估計值, 為誤差范圍
3. 和C的關系為C越大則 越大
(2)置信區間的誤差范圍
1. 高置信度是指結果准確性高,誤差范圍小是指結果精確性高
2. 減小置信斗鄭孝區間誤差范圍 的方法:
①選擇較低的置信度,從而得到更小的
②選擇更大的樣本量n;
③減小σ
三、置信區間與樣本量
1.合理的樣本設計應在進行數據收集前先確定好 統計推斷方法 ,確定足夠的樣本量可使得後期置信區間的誤差范圍較小。
2.根據置信區間誤差范圍計叢吵算公式,計算簡單隨機抽樣的樣本量:
3.實際應用中,樣本量大小的選擇,除上述公式計算結果外,還應考慮其他因素,如數據收集過程中所花費的成本等,確保研究方案實施的可行性。
4.嚴謹的設計通常會事先假定一個 無應答率 ,並以此校正樣本量的計算。
四、注意事項
1.公式不適用於所有抽樣方法,不同的抽樣方法需要採用不同估計公式。
2. 公式適用條件
(1)數據必須來自相應總體的簡單隨機抽樣;
(2)個體間相互獨立;
(3)事先假定總體標准差已知,實際研究中很可能無法得到總體標准差。
3.選用統計方法前需對數據進行探索性分析, 檢查異常值以及數據是否服從正態分布;
4. 統計分析無法拯救糟糕的數據;
5. 實際操作中的問題(如無應答與失訪)會給抽樣研究帶來額外的誤差,這些誤差空稿可能比隨機抽樣誤差大得多,並且研究結果中這些誤差並不能被誤差范圍所反映;
6. 統計推斷的概率是指該方法重復進行的正確頻率,但並不知道某一次結果的正確性。
3. 簡單的統計學例題中,區間估計的α/2值27.488是怎麼得來的急謝謝
2.5%分位是-1.96,97.5%分位是1.96的是正態分布。這題chisq=(n-1)S^2 / sigma^2服從卡方分布,要用卡方分布的分布分位數表,用不上正態分布的分布分位數表。
思路是在H0的情況下,每個糖果服從正態分布,方差是sigma,觀察到比2.5%分位(6.262)更小的chisq值或者比97.5%分位(27.488)更大的chisq值是極端情況喚渣友,極端情況發生的和槐概率是5%,這個5%不是固定的,可以根據題目或者研究的要求來決定。
chisq的置信區間是2.5%分位(6.262)到97.5%分位(27.488)。然後由chisq=(n-1)S^2 / sigma^2反解sigma=S*sqrt(n-1)/sqrt(chisq),把chisq的2.5%分位(6.262)和梁絕97.5%分位(27.488)分別帶進去,得到sigma的置信區間,就是圖上塗黃那塊。
27.488是自由度=15的卡方分布的97.5%分位
α^2原諒我沒看見?
4. 區間估計——置信區間
你可能需要參考這篇文章
抽樣與抽樣分布——中心極限分布、點估計
1. 區間估計
1.1 區間估計
總體參數估計的一個區間,確信該區間將參數值納入其中。
區間估計的形式:點估計±邊際誤差
1.2 置信區間
區間估計中,由樣本估計量構造出的總體參數在一定置信水平下的估計區間。
區間的最小值是置信下限,區間的最大值是置信上限。
1.3 置信水平/置信度/置信系數
假定抽取100個樣本,構造100個置信區間,這100個置信區間中有95%的區間包含了總體參數的真值,5%沒包含,95%被稱為置信水平。
如果將構造置信區間的步驟兄遲重復多次,置信區間中包含總體參數真值的次數所佔比例稱為置信水平。
2. 總體均值的區間估計
2.1 總體均值的區間估計:σ已知
對置信區間的理解,要注意:
(1)總體參數的真值是固定的,樣本構造的區間是不固定的,置信區間是一個隨機區間,會因樣本的不同而變化,而且不是所有的區間都包含總體參數。
一個特定的區間總是「包含」和「絕對不包含」參數的真值,不存在「以多大的概率包含總體參數」的問題。
置信水平知識告訴我們在多次估計得到的區間中大概有多少個區間包含了參數的真值,而不是針對所抽取的這個樣本所構建的區間而言的。
(2)使用一個較大的置信水平會得到一個比較寬的置信區間,而使用一個較大的樣本則會得到一個較准確的區間,
2.2 總體均值的區間估計:σ未知
2.3 樣本容量確定
令E代表希望達到的邊際誤差
得到下面的結論
總體均值區間估計中的樣本容量
σ已知,直接用上面的式子計算。
σ未知,橘歷可以根據以下任一方法確定:
(1)根據以前研究中的數據計算總體標准差的估計值作圓塵搜為σ的計劃值
(2)利用實驗研究,選取一個初始樣本,以初始樣本的標准差作為σ的計劃值。
2.4 總結
在絕大部分應用中n≥30已經夠大。如果總體服從或者近似服從正態分布,可以利用更小的樣本容量。
對於σ未知,如果總體的分布嚴重偏斜或者包含異常點,將樣本容量增加到n≥50。
3. 總體比率的區間估計
3.1 總體比率的區間估計
3.2 樣本容量的確定
令E代表希望達到的邊際誤差
得到下面的結論
總體比率區間估計中的樣本容量
可選擇如下方法確定計劃值p*
(1)用以前相同或類似樣本的樣本比率代替
(2)利用實驗性研究,選取一個初始樣本,以該樣本的樣本比率作為計劃值
(3)使用判斷或最優猜測作為計劃值
(4)如果上述方法均不適用,則去計劃值p*=0.5
5. 統計學題目——總體比例區間估計的
置空舉信區間敬虧梁為(亮運0.1618,0.2382)
6. 統計學第四課:參數估計
參數估計是在樣本統計量概率分布的基礎上,根據樣本信息,推斷總體參數。總體參數用θ表示,用於估計參數的統計量用θ上加一個 ^ 表示,θ^也稱為 估計量 ,根據一個具體的樣本計算出來的估計量的數值成為 估計值 。
方法有兩種:點估計、區間估計。
點估計指的是用估計量的某個取值,作為總體參數θ的估計值。比如用樣本均值作為總體均值的估計值,用樣本比例作為總體比例的估計值等等。再比如,某個產品的樣本良品率是97%,將97%作為這一批產品的良品率。
所以你可以看到,點估計的估計可靠性一般,因為依賴於估計量的可靠性,估計量的可靠性是有其抽樣分布的標准誤來衡量的。這么一來,無法說出點估計值與總體參數的真實值接近程度,我們就需要找其他的解決辦法,比如圍繞估計值構造一個總體參數的區間。
區間估計是在點估計的基礎上得到總體參數的一個估計區間,通常區間是由樣本統計量±估計誤差得來。進行區間估計時,根據樣本梁亂統計量的抽樣分布,可以對統計量與筒體參數的接近程度給出一個概率度量。
實際情況,樣本均值已知總體均值未知,我們求的就是總體均值。可以理解為,總體均值在樣本均值的兩側對稱分布,所吵渣孝以我們可以利用標准誤估計總體均值在多少個標准誤內可以作為總體均值的置信區間。
置信區間說的就是,在區間估計中,由於樣本估計量構造出的總體參數在一定置信水平下的估計區間。其中最小值成為區間下限,最大值成為區間上限。我們有哪個百分數將區間劃分成100份,95%稱為置信水平(也就是距離樣本均值±1.96個標准誤的距離),在這個置信區間中包含總體參數真值次數所佔的比例是置信水平,或成為置信度、置信系數。
-置信區間告訴我們在多次估計得到的區間中,大概有多少個區間包含參數的真值;
-實際運用中過寬的區間意義不大,過窄區間容易漏掉真值;
總體參數真值固定,樣本區間數量不固定;
用於估計總體參數的估計量θ^有很多,什麼樣的估計量算比較好的呢?
無偏性說的是:估計量抽樣分布的期望值=被估計的總體參數。現在有所選估計量的θ^, 總體參數θ,如果E(θ^ )=θ,則θ^是θ的無偏估計量。
有效性指的是估計量的方差大小。表示了估計量接近總體參數的程度,同一個總體的無偏估計量有非常多個,離散最小的則是最好的。
【例】
從均值為0、方差為1的總體抽取10000個樣本量為10的樣本:
1)計算樣本均值方差和樣本中位數方差;
2)進行無偏性和有效性度量模擬;
通過上面的例子的結果可以看出:
通過上面的例子的結果可以看出:
一致性指的是隨著樣本量無限增大,統計量會最終收斂於所估總體的參數內。也就是說,大樣本的估計量更加接近總體參數。
通過上面的例子的結果可以看出:
研究總體時,推斷總體均值的統計量就是樣本均值,研究兩個總體時,關心的參數是兩個總體均值的差值,用於推斷的統計量則是兩個樣本的均值之差。
在對一個總體均值進行區間升稿估計時,需要考慮抽取樣本的總體是否是正態分布、總體方差是否已知、用於估計的樣本是否為大樣本(n≥30)還是小樣本。
總體均值的置信區間都是由樣本均值甲減估計誤差得到的。所以估計誤差有兩部分組成:點估計的標准誤、估計所要求的的置信水平為(1-α)時,統計量分布兩側面積各位α/2時的分位數值。因此,總體均值在(1-α)置信水平下的置信區間可以表達為:
樣本均值 ±(分位數 * 樣本均值的標准誤)
由中心極限定理可知,樣本均值近似服從期望值為μ,方差為σ^2/n的正態分布。樣本均值標准化後得服從標准正態分布,z=(x拔-μ)/(σ/開方n)~N(0,1)。
若總體標准差σ已知,標准化時使用σ;
若σ未知,則用樣本標准差s代替。
因此,可以有正態分布構建總體均值在(1-α)置信水平下的置信區間為:
當總體方差未知時,上述公式的σ替換成s,這是總體均值μ在(1-α)置信水平下的置信區間為:
在小樣本情形下(n<30),對總體均值的估計都是建立在總體服從正態分布的假設前提下。
設有兩個總體均值μ1、μ2。從兩個總體中分別抽取樣本量為n1、n2的兩個隨機樣本。均值為x1拔、x2拔。
估計兩個總體均值之差的點估計量顯然是兩個樣本的均值之差,也就是(μ1-μ2)=(x1拔-x2拔)
估計原理與一個總體均值的區間估計類似。兩個總體均值之差在(1-α)的置信水平下的置信區間可以表示為:
如果兩個樣本是從兩個總體中獨立抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立,這就是 獨立樣本 。
如果兩個樣本都為大樣本,那麼兩個樣本均值之差近似服從期望值為(μ1-μ2)、方差為(σ1^ 2/n1+σ2^ 2/n2)的正態分布,兩個樣本均值之差經過標准化後側服從標准正態分布:
【例】
研究男女的工資差異,選取男女工資各40人的隨機工資樣本,建立男女平均工資之差的95%置信區間。
當兩個樣本都是獨立小樣本時,估計兩個總體均值之差需要假設兩個總體都服從正態分布。
【例】
如果有兩組方法進行組裝產品,分別記錄同樣的12個工人分別組裝,得到兩個方法各12個組裝時間。假定組裝時間都是服從正態分布的,計算:
1)如果兩個總體方差相等,方法的樣本均值差,在95%的置信區間是多少?
2)如果兩個總體方差不等,方法的樣本均值差,在90%的置信區間是多少?
用兩個獨立樣本估計兩個總體均值之差時有獨立的弊端,比如偶爾會將某些不不好的參數抽樣到一起,這時候,兩個樣本的對比會顯得不公平。配對樣本估計就是解決這類問題:也就是一個樣本中的數據與兩一個樣本中的數據相對應,這樣的數據通常是對同一個體所做的前後兩次的測量。比如,前指定某10個人用第一種工具組裝產品,再讓這10個人用第二種工具組裝產品,得到兩種工具組裝產品的總工時數據,這就是配對數據。
使用配對樣本進行估計時,在大樣本條件下,兩個總體均值之差μd=μ1-μ2,在(1-α)置信水平下的置信區間為:
其中,d表示兩個配對數據的差值,d拔表示個差值的均值,σd表示各個差值的標准差,當總體σd未知時,可用樣本差值sˇd來替代。
在小樣本情形下,假定兩個總體各觀察值的配對差服從正態分布,兩個總體均值之差μd=μ1-μ2,在(1-α)置信水平下的置信區間為:
兩個總體之差的估計需要考慮樣本來那個的大蝦,如果兩個樣本量都非常大,可以採用傳統的估計方法,如果兩個樣本量是中等大小或者比較小,,需要對樣本量和實驗成功次數做出修正以改進估計的區間。
兩個總體比例之差的區間估計原理與一個總體比例的區間估計相同。
估計中體方差是,首先假定總體服從正態分布,其原理與總體均值和總體比例的區間估計不同,不再是點估計量±估計誤差。因為樣本方差的抽樣分布服從自由度為(n-1)的x^2 分布構造總體方差的置信區間,由於x^2不是對稱分布,無法由點估計值±估計誤差的大總體方差的置信區間。
比較兩個總體方差的問題,一般由於兩個樣本店額方差服從了F(n1-1,n2-1)分布,因此可以用F分布來構造兩個總體方差比的置信區間。
7. 【高分】求李沛良《社會研究的統計應用》計算題及答案,要詳細解答過程。
上位機CAN卡到是經常出問題。。。。。最後發現,當CAN—L和CAN—H短路後,can卡就失靈了
8. 抽樣平均誤差的詳解
抽樣推斷的一般概念
抽樣推斷是在根據隨機原則從總體中抽取部分實際數據的基礎上,運用數理統計方法,對總體某一現象的數量性作出具有一定可靠程度的估計判斷。抽樣推斷具有這些特點: 它是由部分推算整體的一種認識方法;它是建立在隨機取樣的基礎上。它是運用概率估計的方法;抽樣推斷的誤差可以事先計算並加以控制。
抽樣推斷的主要內容為:參數估計和假設檢驗 。
抽樣的基本概念
1、全及總體和樣本總體
全及總體是我們所要研究的對象,而樣本總體則是我們所要觀察的對象,兩者是有區別而又有聯系的不同范疇。全及總體又稱母體,簡稱總體,它是指所要認識的,具有某種共同性質的許多單位的集合體。樣本總體又稱子樣,簡稱樣本,是從全及總體中隨機抽取出來,代表全及總體的那部分單位的集合體。樣本總體的單位數稱為樣本容量,通常用小寫英文字母n來表示。隨著樣本容量的增大,樣本對總體的代表性越來越高,並且當樣本單位數足夠多時,樣本平均數愈接近總體平均數。
如果說對於一次抽樣調查,全及總體是唯一確定的,那麼樣本總體就不是這樣,樣本是不確定的,一個全及總體可能抽出很多個樣本總體,樣本的個數和樣本的容量有關,也和抽樣的方法有關。
2、全及指標和抽樣指標
根據全及總體各個單位的標志值或標志屬性計算的,反映總體某種屬性或特徵的綜合指示稱為全及指標。常用的全及指標有總體平均數(或總體成數)、總體標准差(或總體方差 )。
由樣本總體各單位標志值計算出來反映樣本特徵,用來估計全及指標的綜合指標稱為統計量(抽樣指標)。統計量是樣本變數的函數,用來估計總體參數,因此與總體參數相對應,統計量有樣本平均數(或抽樣成數)、樣本標准差(或樣本方差 )。
對於一個問題全及總體是唯一確定的,所以全及指標也是唯一確定的,全及指標也稱為參數,它是待估計的數。而統計量則是隨機變數,它的取值隨樣本的不同而發生變化。
3、樣本容量和樣本個數
樣本容量是指一個樣本所包含的單位數。通常將樣本單位數不少於30個的樣本稱為大樣本,不及30個的稱為小樣本。社會經濟統計的抽樣調查多屬於大樣本調查。樣本個數又稱樣本可能數目。指從一個總體中可能抽取的樣本個數。一個總體有多少樣本,則樣本統計量就有多少種取值,從而形成該統計量的分布,此分布是抽樣推斷的基礎。
4、重復抽樣和不重復抽樣
抽樣誤差
抽樣誤差是指由於隨機抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起抽樣指標和全及指標之間的絕對離差。因此,又
稱為隨機誤差,它不包括登記誤差,也不包括系統性誤差。
影響抽樣誤差的因素有:總體各單位標志值的差異程度;樣本的單位數;抽樣的方法;抽樣調查的組織形式。
1、抽樣平均誤差。抽樣平均誤差的作用首先表現在它能夠說明樣本指標代表性的大小。平均誤差大,說明樣本指標對總體指標的代表性低;反之,則跡塌高 。
2、抽樣極限誤差。抽樣極限則說明樣本指標對總體指標的代表性高。其次,平均誤差還說明樣本指標與總體指標差別的一般范圍。這個范圍實際上就是抽樣極限誤差。
抽樣平均誤差的計算:
重復抽樣:
不重復抽樣: 誤差是指用絕對值形式表示的樣本指標與總體指標偏差的可允許的最大范圍。它表明被估計的總體指標有希望落在一個以樣本指標為基礎的可能范圍。它是由抽樣指標變動可允許伏州帶的上限或下限與總體指標之差的絕對值求得的。
由於總體平均數和總體成數是未知的,它要靠實測的抽樣平均數成數來估計。因而抽樣極限誤差的實際意義是希望總體平均數落在抽樣平均數的范圍內,總體成數落在抽樣成數的范圍內。
基於理論上的要求,抽樣極限誤差需要用抽樣平均誤差 或 為標准單位來衡量。即把極限誤差 △x或 △p相應除以 或 ,得出相對的誤差程度t倍,t稱為抽樣誤差的概率度。於是有:
抽樣估計方法
抽樣估計缺蘆就是利用實際調查計算的樣本指標值來估計相應的總體指標數值。抽樣估計有點估計和區間估計兩種
參數點估計的基本特點:根據總體指標的結構形式設計樣本指標作為總體參數的估計量,並以樣本指標的實際值直接作為相應總體參數的估計值。點估計的優良標準是無偏性、一致性和有效性。
抽樣估計的置信度是表明抽樣指標和總體指標的誤差不超過一定范圍的概率有多大。
參數區間估計的基本特點:
根據給定的概率保證程度的要求,利用實際抽樣資料,指出總體被估計值的上限和下限,即指出總體參數可能存在的區間范圍,而不是直接給出總體參數的估計值。
總體參數區間估計根據給定的概率保證程度的要求,利用實際抽樣資料,指出被估計值的上限和下限,即指出總體參數可能存在的區間范圍。總體參數區間估計必須同時具備估計值、抽樣誤差范圍和概率保證程度三個要素。
區間估計的內容包括總體平均數和總體成數的估計。
例1、某學校進行一次英語測驗,為了解學生的考試情況,隨機抽選部分學生進行調查,所得資料如下: 考試成績 學生人數 60以下 10 60-70 20 70-80 22 80-90 40 90-100 8 試以95.45%的可靠性估計該校學生英語考試的平均成績的范圍及該校學生成績在80分以上的學生所佔的比重的范圍。
解:(1)該校學生英語考試的平均成績的范圍:
σ=11.377
△x = tμx=2×1.1377=2.2754
該校學生考試的平均成績的區間范圍是:
x - △x≤X≤ x+△x
76.6-2.2754≤X≤76.6+2.2754
74.32≤X≤78.89
(2)該校學生成績在80分以上的學生所佔的比重的范圍
△p=tμp=2×0.04996=0.09992
80分以上學生所佔的比重的范圍:
P=p±△p=0.48±0.09992
0.3801≤P≤0.5799
在95.45%概率保證程度下,該校學生成績在80分以上的學生所佔的比重的范圍在38.01%—57.99%之間。
這是在簡單抽樣條件下進行區間估計的例題。從上面的解法中,我們可以總結出這一類計算題的基本做法:先計算出樣本指標,然後根據所給條件(重復抽樣或不重復抽樣)進行抽樣平均誤差的計算,抽樣極限誤差的計算,最後根據樣本指標和極限誤差進行區間估計。
例2、從某年級學生中按簡單隨機抽樣方式抽取40名學生,對公共理論課的考試成績進行檢查,得知其平均分數為78.75分,樣本標准差為12.13分,試以95.45%的概率保證程度推斷全年級學生考試成績的區間范圍。如果其它條件不變,將允許誤差縮小一半,應抽取多少名學生?
解:n=40 x=78.56 σ=12.13 t=2
(1)
μx=12.13/sqrt(40)=1.92
△x = tμx=2×1.92=3.84
全年級學生考試成績的區間范圍是:
x - △x≤X≤ x+△x
78.56-3.84≤X≤78.56+3.84
74.91≤X≤82.59
(2)將誤差縮小一半,應抽取的學生數為: (人)
n=(12.13*2/1.92)^2=160
抽樣組織形式
常用的抽樣組織形式有:簡單隨機抽樣、類型抽樣、等距抽樣和整群抽樣。
通俗的講抽樣誤差就是指樣本指標與全及總體指標之間的絕對誤差。在進行抽樣檢查時不可避免會產生抽樣誤差,因為從總體中隨機抽取的樣本,其結構不可能和總體完全一致。例如樣本平均數與總體平均數之差| x − X |(註:x與X上都還有一橫代表平均數,這里打不出來),樣本成數與總體成數之差 | p − P | 。雖然抽樣誤差不可避免,但可以運用大數定律的數學公式加以精確地計算,確定它具體的數量界限,並可通過抽樣設計加以控制。
9. 如何在SPSS中實現總體方差的區間估計
問該高校英語水平與全省大學生是否基本一致?設α=0.05
♦ 打開SPSS,建立數據文件:「大學生四級英語測驗桐簡賣.sav」咐逗。這里,研究變數為:
分數。
♦ 選擇區間局逗估計選項,方法如下: 選擇菜單【分析】—>【描述統計】—>【探
索】」 ,打開【探索】對話框。