A. 重復抽樣的特點是什麼
重復抽樣也稱為回置抽樣,即每次抽中一個樣本單位並進行登記後,再將其放回總體中參加下一次抽樣,每一個樣本單位都有被重復抽中的可能。重復抽樣的特點是,同一個單位可能會在一個樣本中重復出現;每個樣本單位被抽中的概率都相等,概率等於1/N。
例如採用重復抽樣方法從總體30個單位中隨機抽取5個單位構成樣本,N= 30,n= 5。其具體方法為抽取一個單位並記錄其編號後,將該單位放回總體中再進行下一個單位的抽取,連續抽取5次,抽得5個單位構成一個樣本,每個樣本單位被抽中的概率都是1/30。
(1)重復抽樣概率的計算方法擴展閱讀:
注意事項:
1、在實際的產品質量檢測中,會直接抽取產品進行質量檢測,如果是在Excel中,要隨機進行抽取,更多的是使用函數。
2、做預測(包含分類和回歸)分析建模的,需要考慮特徵數量和特徵值域(非數值)的分布,通常數據記錄數同時是特徵數量和特徵值域的100倍以上。
3、做關聯規則分析模型,根據關聯前後項的數量,每個主體需要至少1000條數據。
4、異常檢測類分析建模,無論是監督還是非監督建模,數據記錄越多越好。
B. 樣本量的計算公式
(1)重復抽樣方式下:n為樣本容量、d為抽樣誤差范圍、σ為標准差,一般取0.5。
變數總體重復抽樣計算公式:
(2)重復抽樣概率的計算方法擴展閱讀
合理確定樣本容量的意義:
1、樣本容量過大,會增加調查工作量,造成人力、物力、財力、時間的浪費;
2、樣本容量過小,則樣本對總體缺乏足夠的代表性,從而難以保證推算結果的精確度和可靠性;
3、樣本容量確定的科學合理,一方面,可以在既定的調查費用下,使抽樣誤差盡可能小,以保證推算的精確度和可靠性;另一方面,可以在既定的精確度和可靠性下,使調查費用盡可能少,保證抽樣推斷的最大效果。