A. 重复抽样的特点是什么
重复抽样也称为回置抽样,即每次抽中一个样本单位并进行登记后,再将其放回总体中参加下一次抽样,每一个样本单位都有被重复抽中的可能。重复抽样的特点是,同一个单位可能会在一个样本中重复出现;每个样本单位被抽中的概率都相等,概率等于1/N。
例如采用重复抽样方法从总体30个单位中随机抽取5个单位构成样本,N= 30,n= 5。其具体方法为抽取一个单位并记录其编号后,将该单位放回总体中再进行下一个单位的抽取,连续抽取5次,抽得5个单位构成一个样本,每个样本单位被抽中的概率都是1/30。
(1)重复抽样概率的计算方法扩展阅读:
注意事项:
1、在实际的产品质量检测中,会直接抽取产品进行质量检测,如果是在Excel中,要随机进行抽取,更多的是使用函数。
2、做预测(包含分类和回归)分析建模的,需要考虑特征数量和特征值域(非数值)的分布,通常数据记录数同时是特征数量和特征值域的100倍以上。
3、做关联规则分析模型,根据关联前后项的数量,每个主体需要至少1000条数据。
4、异常检测类分析建模,无论是监督还是非监督建模,数据记录越多越好。
B. 样本量的计算公式
(1)重复抽样方式下:n为样本容量、d为抽样误差范围、σ为标准差,一般取0.5。
变量总体重复抽样计算公式:
(2)重复抽样概率的计算方法扩展阅读
合理确定样本容量的意义:
1、样本容量过大,会增加调查工作量,造成人力、物力、财力、时间的浪费;
2、样本容量过小,则样本对总体缺乏足够的代表性,从而难以保证推算结果的精确度和可靠性;
3、样本容量确定的科学合理,一方面,可以在既定的调查费用下,使抽样误差尽可能小,以保证推算的精确度和可靠性;另一方面,可以在既定的精确度和可靠性下,使调查费用尽可能少,保证抽样推断的最大效果。