⑴ 計量資料的統計描述和統計推斷各有哪些方法
描述統計,又稱敘述統計,是統計學中,來描繪或總結觀察量的基本情況的統計總稱。其與推論統計相對應。
1、研究者可以透過對數據資料的圖像化處理,將資料摘要變為圖表,以直觀了解整體資料分布的情況。通常會使用的工具是頻數分布表與圖示法,如多邊圖、直方圖、餅圖、散點圖等。
2、研究者也可以透過分析數據資料,以了解各變數內的觀察值集中與分散的情況。運用的工具有:集中量數,如平均數、中位數、眾數、幾何平均數、調和平均數。與變異量數,如全距、平均差、標准差、相對差、四分差。
3、為了解個別觀察值在整體中所佔的位置,會需要將觀察值轉換為相對量數,如百分等級、標准分數、四分位數等。
統計推斷指統計學中,研究如何根據樣本數據去推斷總體數量特徵的方法。它是在對樣本數據進行描述的基礎上,對統計總體的未知數量特徵做出以概率形式表述的推斷。更概括地說,是在一段有限的時間內,通過對一個隨機過程的觀察來進行推斷的。
在質量活動和管理實踐中,人們關心的是特定產品的質量水平,如產品質量特性的平均值、不合格品率等。這些都需要從總體中抽取樣本,通過對樣本觀察值分析來估計和推斷,即根據樣本來推斷總體分布的未知參數,稱為參數估計。參數估計有兩種基本形式:點估計和區間估計。
⑵ 統計方法有哪些在什麼情況下用什麼方法
1.計量資料的統計方法
分析計量資料的統計分析方法可分為參數檢驗法和非參數檢驗法。
參數檢驗法主要為t檢驗和方差分析(ANOVN,即F檢驗)等,兩組間均數比較時常用t檢驗和u檢驗,兩組以上均數比較時常用方差分析;非參數檢驗法主要包括秩和檢驗等。t檢驗可分為單組設計資料的t檢驗、配對設計資料的t檢驗和成組設計資料的t檢驗;當兩個小樣本比較時要求兩總體分布為正態分布且方差齊性,若不能滿足以上要求,宜用t 檢驗或非參數方法(秩和檢驗)。方差分析可用於兩個以上樣本均數的比較,應用該方法時,要求各個樣本是相互獨立的隨機樣本,各樣本來自正態總體且各處理組總體方差齊性。根據設計類型不同,方差分析中又包含了多種不同的方法。對於定量資料,應根據所採用的設計類型、資料所具備的條件和分析目的,選用合適的統計分析方法,不應盲目套用t檢驗和單因素方差分析。
2.計數資料的統計方法
計數資料的統計方法主要針對四格表和R×C表利用檢驗進行分析。 四格表資料:組間比較用
檢驗或u檢驗,若不能滿足 檢驗:當計數資料呈配對設計時,獲得的四格表為配對四格表,其用到的檢驗公式和校正公式可參考書籍。 R×C表可以分為雙向無序,單向有序、雙向有序屬性相同和雙向有序屬性不同四類,不同類的行列表根據其研究目的,其選擇的方法也不一樣。
3.等級資料的統計方法
等級資料(有序變數)是對性質和類別的等級進行分組,再清點每組觀察單位個數所得到的資料。在臨床醫學資料中,常遇到一些定性指標,如臨床療效的評價、疾病的臨床分期、病症嚴重程度的臨床分級等,對這些指標常採用分成若干個等級然後分類計數的辦法來解決它的量化問題,這樣的資料統計上稱為等級資料。
⑶ 統計推斷常用的方法有
(1)簡單隨機抽樣:
簡單隨機抽樣,是指抽樣過程應獨立進行並且總體中每個個體被抽到的機會均等。隨機抽樣不是隨便抽取,隨便抽取容易受到個人好惡的影響。為實現隨機化,可採取抽簽、擲隨機數骰子或查隨機數值表等辦法。如從100件產品中隨機抽取l0件組成樣本,可以把這100件產品從l開始編號直到100號,然後用抓鬮的辦法任意抽出l0個編號,由這l0個編號代表的產品組成樣本。此種抽樣方法的優點是抽樣誤差小,缺點是手續繁雜。在實踐中真正做到每個個體被抽到的機會相等是不容易的。
(2)周期系統抽樣:
周期系統抽樣,又叫等距抽樣或機械抽樣,即將總體按順序編號,用抽簽或查隨機數值表的方法確定首件,進而按等距原則依次抽取樣本。如從120個零件中取五個做樣本,先按生產順序給產品編號,用簡單隨機抽樣法確定首件,然後按每隔24(由120÷5=24得)個號碼抽取一個,共抽取五個組成樣本。這種方法特別適用於流水線上取樣,操作簡便,實施起來不易出現差錯。但抽樣起點一經確定,整個樣本就完全固定。對總體質量特性含有某種周期性變化,而當抽樣間隔恰好與質量特性變化周期吻合時,就可能得到一個偏差很大的樣本。
(3)分層抽樣法:
分層抽樣法,即從一個可以分成不同子總體的總體中,按規定比例從不同層中隨機抽取個體的方法。當不同設備、不同環境生產同一種產品時,由於條件差別產品質量可能有較大差異,為了使所抽取的樣本具有代表性,可以將不同條件下生產的產品組成組,使同一組內產品質量均勻,然後在各組內按比例隨機抽取樣品合成一個樣本。這種抽樣方法得到的樣本代表性比較好,抽樣誤差較小,缺點是抽樣手續較繁,常用於產品質量檢驗。
(4)整群抽樣法:
這種方法是先將總體按一定方式分成多個群,然後隨機地抽取若干群並由這些群中的所有個體組成樣本。如按照生產過程將1000個零件分別裝入20個箱中,每箱50個,然後隨機抽取一箱,此箱中50個零件組成樣本。這種抽樣方法實施方便,但樣本來自個別群體而不能均勻分布在總體中,因而代表性差,抽樣誤差較大。
⑷ 統計推斷的內容主要包括什麼和什麼
統計推斷的內容主要包括:參數估計和假設檢驗。
參數估計(parameter estimation),統計推斷的一種。根據從總體中抽取的隨機樣本來估計總體分布中未知參數的過程。從估計形式看,區分為點估計與區間估計:從構造估計量的方法講,有矩法估計、最小二乘估計、似然估計、貝葉斯估計等。要處理兩個問題:(1)求出未知參數的估計量;(2)在一定信度(可靠程度)下指出所求的估計量的精度。信度一般用概率表示,如可信程度為95%;精度用估計量與被估參數(或待估參數)之間的接近程度或誤差來度量。
假設檢驗(hypothesis testing),又稱統計假設檢驗,是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。顯著性檢驗是假設檢驗中最常用的一種方法,也是一種最基本的統計推斷形式,其基本原理是先對總體的特徵做出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受做出推斷。常用的假設檢驗方法有Z檢驗、t檢驗、卡方檢驗、F檢驗等。
⑸ 推斷統計的主要方法有哪些
推斷統計的主要方法有,根據樣本觀測值、樣本期望、樣本方差,構造已知分布的統計量,進行推斷統計。
⑹ 統計推斷(區間估計)
一、置信區間的估計
1.統計推斷:統計推斷是基於樣本統計量對總體參數給出統計學結論
2.常用方法:置信區間估計和假設檢驗
3.95%置信度的含義: 100次抽樣結果的100個95%置信區間中,平均而言有95個置信區間包含了真實的總體均數。置信度常用C表示
二、置信區間
(1)已知σ時μ的置信區間
1.樣本量為n的簡單隨機抽樣數據,估計總體均數μ的置信區間,當總體分布服從正態分布時,樣本均數μ服從
2.對於一個觀察到的樣本,μ的置信度為C的置信區間為 ,其中 為μ的估計值, 為誤差范圍
3. 和C的關系為C越大則 越大
(2)置信區間的誤差范圍
1. 高置信度是指結果准確性高,誤差范圍小是指結果精確性高
2. 減小置信斗鄭孝區間誤差范圍 的方法:
①選擇較低的置信度,從而得到更小的
②選擇更大的樣本量n;
③減小σ
三、置信區間與樣本量
1.合理的樣本設計應在進行數據收集前先確定好 統計推斷方法 ,確定足夠的樣本量可使得後期置信區間的誤差范圍較小。
2.根據置信區間誤差范圍計叢吵算公式,計算簡單隨機抽樣的樣本量:
3.實際應用中,樣本量大小的選擇,除上述公式計算結果外,還應考慮其他因素,如數據收集過程中所花費的成本等,確保研究方案實施的可行性。
4.嚴謹的設計通常會事先假定一個 無應答率 ,並以此校正樣本量的計算。
四、注意事項
1.公式不適用於所有抽樣方法,不同的抽樣方法需要採用不同估計公式。
2. 公式適用條件
(1)數據必須來自相應總體的簡單隨機抽樣;
(2)個體間相互獨立;
(3)事先假定總體標准差已知,實際研究中很可能無法得到總體標准差。
3.選用統計方法前需對數據進行探索性分析, 檢查異常值以及數據是否服從正態分布;
4. 統計分析無法拯救糟糕的數據;
5. 實際操作中的問題(如無應答與失訪)會給抽樣研究帶來額外的誤差,這些誤差空稿可能比隨機抽樣誤差大得多,並且研究結果中這些誤差並不能被誤差范圍所反映;
6. 統計推斷的概率是指該方法重復進行的正確頻率,但並不知道某一次結果的正確性。