⑴ 总体参数区间估计的方法有哪些
区间估计的概念
区间估计是根据样本统计量,利用抽样分布的原理,用概率表示总体参数可能落在某数值区间之内的推算方法。
区间估计的原理
区间估计的理论依据是抽样分布理论。现在以总体平均数区间估计为例,说明区间估计的基本原理。
总体参数区间估计的计算方法
由于样本容量、总体分布状态等多方面因素对总体参数估计的可信度都会产生不同程度的影响,因此,在进行总体参数估计时要针对不同情况区别对待。
大样本总体平均数的区间估计
要对总体平均数μ做出比较准确的估计,就要合理地确定平均数样本分布的标准差即标准误。事实上,标准误与样本容量和总体分布的标准差关系密切。当样本容量n大于30的时候,样本标准差S与总体标准差σ相差不会很大,一般就可以利用S来做σ的估计值。同时,随着样本容量的增加,样本平均数与总体平均数的差距就会缩小,即标准误就会减小。
⑵ 统计学中区间估计的概念是什么
区间估计
qujian guji
区间估计
interval estimation
参数估计的一种形式。通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。例如,估计一种药品所含杂质的比率在1~2%之间;估计一种合金的断裂强度在1000~1200千克之间,等等。在有的问题中,只需要对未知量取值的上限或下限作出估计。如前例中,一般只对上限感兴趣,而在第二例中,则只对下限感兴趣。
在数理统计学中,待估计的未知量是总体分布的参数或的某个函数()。区间估计问题可一般地表述为:要求构造一个仅依赖于样本X=(1,2,…,)的适当的区间[(X),(X)],一旦得到了样本X[2kg]的观测值,就把区间[(),()]作为或()的估计至于怎样的区间才算是“适当”,如何去构造它,则与所依据的原理和准则有关。这些原理、准则及构造区间估计的方法,便是区间估计理论的研究对象。作为参数估计的形式,区间估计与点估计是并列而又互相补充的,它与假设检验也有密切的联系。
置信区间理论 这是1934年,由统计学家J.奈曼所创立的一种严格的区间估计理论。置信系数是这个理论中最为基本的概念。
置信系数 奈曼以概率的频率解释为出发点,认为被估计的是一未知但确定的量,而样本X是随机的。区间[(X),(X)]是否真包含待估计的,取决于所抽得的样本X。因此,区间 [(X),(X)]只能以一定的概率[537-03]包含未知的。对于不同的,()之值可以不同,()对不同的取的最小值1-(0<<1)称为区间[(X),(X)]的置信系数。与此相应,区间[(X),(X)]称为的一个置信区间。这个名词在直观上可以理解为:对于“区间[(X),(X)]包含”这个推断,可以给予一定程度的相信,其程度则由置信系数表示。
对的上、下限估计有类似的概念,以下限为例,称(X)为的一个置信下限,若一旦有了样本X,就认为不小于(X),或者说,把估计在无穷区间[(X),∞)内。“不小于(X)”这论断正确的概率为[537-04][537-4])。1()对不同的[2kg][2kg]取的最小值[2kg]1-(0<<1)称为置信下限(X)的置信系数。
在数理统计中,常称不超过置信系数的任何非负数为置信水平。
优良性准则 置信系数1- 反映了置信区间[(X),(X)]的可靠程度,1-愈大,[(X),(X)]用以估计时,犯错误(即并不在[(X),(X)]之内)的可能性愈小。但这只是问题的一个方面。为了使置信区间[(X),(X)] 在实际问题中有用,它除了足够可靠外,还应当足够精确。比如说,估计某个人的年龄在 5至95岁之间,虽十分可靠,但太不精确,因而无用。通常指定一个很小的正数(一般, 取0.10,0.05,0.01等值),要求置信区间[(X),(X)]的置信系数不小于1-,在这个前提下使它尽可能地精确。对于“精确”的不同的解释,可以导致种种优良性标准。比较重要的有两个:一是考虑区间的长度(X)-(X)愈小愈好。这个值与X有关,一般用其数学期望E((X)-(X))作为衡量置信区间[(X),(X)] 精确程度的指标。这个指标愈小, 置信区间的精确程度就愈大。另一个是考虑置信区间 [(X), (X)]包含假值(指任何不等于被估计的 的值) 的概率[537-5][537-05],它愈小,[(X),(X)]作为的估计的精度就愈高。
如果(X)是的置信下限,则在保证(X)的置信系数不小于1-[2kg]的前提下,(X)愈大,精确程度愈高。这也可以用[(X) ,∞)包含假值(<)的概率[537-5][537-06]来衡量,此概率愈小,置信下限(X)的精确程度愈高。对置信上限有类似的结果,若在某个准则下,一个置信区间(或上、下限)比其他置信区间都好,则称它为在这个准则下是一致最优的。例如,在上述准则下,置信系数1-的一致最优置信下限(X)定义为:(X)有置信系数1- ,且对任何有置信系数1-的置信下限1(X),当<时,成立[537-07]
有时,对所考虑的置信区间(或上、下限)加上某种一般性限制,在这个前提下寻
⑶ 区间估计的基本步骤
设 θ 是总体的一个待估参数,其一切可能取值组成的参数空间为,从总体中获得容量为 n 的样本是X1,X2,X3,... ...,Xn,对给定的 α (0<α<1),确定两个统计量,即估计量下界 θL=θL (X1,X2,X3,... ...,Xn)与估计量上界θu=θu(X1,X2,X3,... ...,Xn)。
若对任意 θ∈有P(θL≤θ≤θu)≥1-α,则称随机区间[θL,θu]是θ的置信水平为1-α的置信区间,也简称[θL,θu]是θ的1-α置信区间。θL与 θu 分别称为1-α的置信下限与置信上限。
(3)区间估计的一般方法和步骤扩展阅读
容忍限与容忍区间
这是一个与区间估计有密切联系的概念,但处理的问题不同。给定β,у,0<;β<1,0<;у<1,以F记总体分布。若T(X)为一统计量,满足条件,则称 T(X)为总体分布F 的上(β,у)容忍限。
类似地可定义下(β,у)容忍限。若T1(X)和T2(X)为两个统计量,T1(X)≤T2(X),且,则称 【T1(X),T2(X)】 为总体分布的一个(β,у)容忍区间。
例如,X是某产品的质量指标,而F为其分布,则(β,у)容忍区间【T1(X),T2(X)】的意义是:至少有1-β的把握断言“至少有100(1-у)%的产品,其质量指标落在区间【T1(X),T2(X)】之内”。可以说,容忍区间估计的是总体分布的概率集中在何处,而非总体分布参数。
⑷ 区间估计的求解步骤
区间估计的概念所述点估计是用一个点(即一个数)去估计未知参数。顾名思义,区间估计(Interval estimator)就是用一个区间去估计未知参数,即把未知参数值估计在某两界限之间。例如,估计明年GDP增长在7%~8%之间,比说增长8%更容易让人们相信,因为给出7%~8%已把可能出现的误差考虑到了。
现今最流行的一种区间估计理论是统计学家J.Neyman在20世纪30年代建立起来的,现叙述如下。
设是来自密度函数的样本,对给定的α,0<α<1,如能找到两个统计量及使得
是信度为1-α的θ的置信区间(Confidence interval)
α称为显着性水平(Significance level)。
对于置信区间和信度(或置信水平(Level of Confidence)),可以用频率来说明。如果是置信水平为0.95的置信区间,只要反复从中取样,每次由样本去算出,于是区间不尽相同,有的包含真值θ,有的并不包含θ,包含θ的区间出现的频度应在0.95附近波动。
置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显着性水平表达了区间估计的不可靠的概率,例如α=0.01或1%,是说总体指标在置信区间内,平均100次有1次会产生错误。
关于置信概率,在统计学中进行区间估计时,按照一定要求总是先定好标准,通常采用三个标准:
1-α=0.95 即α=0.05
或 1-α=0.99 即α=0.01
或 1-α=0.999 即α=0.001
当然,在进行区间估计时,必须同时考虑置信概率与置信区间两个方面,即置信概率定得越大(即估计的可靠性越大),则置信区间相应也越大(即估计精确性越小),所以,可靠性与精确性要结合具体问题、具体要求来全面考虑。
⑸ 什么叫点估计和区间估计
点估计(point estimation)是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计和区间估计属于总体参数估计问题。
区间估计(interval estimate)是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。与点估计不同,进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。
常见形式
简介
区间估计,区间估计的区间上、下界通常形式为:“点估计±误差”
“总体均值”的区间估计
符号假设
总体均值:μ
总体方差:σ
样本均值:x* =(1/n)×Σ(Xi)
样本方差:s* =(1/(n-1))×Σ(Xi-x*)^2
置信水平:1-α
⑹ 区间估计的方法
(见贝叶斯统计)也是一个重要的构造区间估计的方法。统计决策理论中引进的一些概念和优良性准则,也可用于区间估计。此外序贯方法(见序贯分析)在区间估计中也有了相当的发展。
区域估计 有时要对两个或更多的参数θ=(θ1,θ2,…,θk)(k>1),例如正态分布N(μ,σ2)中的μ与σ2,同时进行估计;这时,每当有样本X,就由X在θ的取值的k维空间Rk内定出一个区域Q(X),而把θ估计在Q(X)内。这种估计叫做区域估计。所用区域一般为比较简单的几何形状,如长方体、球或椭球等。关于区域估计的置信系数、优良性准则及其求法等,与区间估计情况相似。
容忍限与容忍区间 这是一个与区间估计有密切联系的概念,但处理的问题不同。给定β,у,0<;β<1,0<;у<1,以F记总体分布。若T(X)为一统计量,满足条件,则称 T(X)为总体分布F 的上(β,у)容忍限。类似地可定义下(β,у)容忍限。若T1(X)和T2(X)为两个统计量,T1(X)≤T2(X),且,则称 【T1(X),T2(X)】 为总体分布的一个(β,у)容忍区间。例如,X是某产品的质量指标,而F为其分布,则(β,у)容忍区间【T1(X),T2(X)】的意义是:至少有1-β的把握断言“至少有100(1-у)%的产品,其质量指标落在区间【T1(X),T2(X)】之内”。可以说,容忍区间估计的是总体分布的概率集中在何处,而非总体分布参数。
⑺ 估计的置信度
在大多数的研究中,我们无法获取研究对象的总体数据,或者能获取但是成本非常大。实际情况中,我们往往是通过抽样的方法,在总体中进行随机抽样。根据获取的这部分样本数据去推动总体的一些属性。比如通过抽样人群的平均身高去估计所有人群的平均身高,通过抽样人群中的男女比例,去估计我国当前的男女比例状况。
抽样样本量是直接影响到最终的估计准确度,所以这一章节,先来介绍下如何判断一种估计方法准确与否。
统计估计
统计中估计的方法有两类:点估计,区间估计。 比如问男性平均身高是多少,167cm就是一个点估计,160-170就是区间估计。
置信区间
根据前面介绍的常用的三种估计类型,其置信区间的计算方式也有所不同。
例:假设抛掷一枚不均匀的硬币,其正面朝上的真实概率P位置,每次实验结果只有X=1表示正面,X=0表示反面两种结果。现在实验了n次,其中正面向上个数是k次,想估计下这个硬币正面朝上的概率是多少。
如果用点估计,自然的会用频率 去估计真实的频率。而区间估计的主要步骤如下:
所以有
经典的Wald区间
Wald估计是用样本比例替代整体比例,比例估计的置信区间是
以上的置信区间是有个前提的:样本量比较大的时候,np>5且n(1-p)>5,二项分布才会近似是正态分布。
在样本量比较小,或者是真实的p值接近0或者1的时候,估计的就不是很准确了。
小样本的比例估计
在实际的问题中,这种情况也是经常存在的。以搜索为例,一个具体的搜索策略上线前,通常都会对实验组和对照组进行一些人工评估。因为人力成本问题,一般是评估100或200qu。可能里面的good或者bad的case占比非常少,那么在估计good或badcase的比例的时候置信度就不是很高。
下面介绍几种常用的修正的区间估计
(0) 精确区间
所谓精确区间,其实就是不对齐分布进行近似,而是直接使用原始的真实分布。我们知道正面朝上的个数k其真实分布是二项分布。这个一开始是Clopper和Pearson在1934年研究出来的,所以也叫做C-P 置信区间
最终可以反解出来这个置信下限和置信上限,这里就不在列出具体公式了。
(1)Wilson区间/Wald矫正区间
注意Wilson和wald两种方法上的区别,wald在设置置信区间的时候是简化了问题,用样本比例近似了真实的比例。wilson认为
简单的推理过程如下
最终推导出来的置信区间是
(2)wald矫正区间
上述的置信区间有一个简单的计算方式-加2法,即在数据中增加2个成功案例和2个失败案例,然后再用传统的wald区间估计方法
这是因为
我们做置信区间或者参数估计,最终目的是希望通过样本的数据去获得总体的信息。常见的就是对总体集中趋势的估计,而这种”集中趋势“根据数据本身的分布情况,可能会采取均值、中位数、众数做为其估计
(1)基于均值的
基于均值的估计,一般是在假设其分布比较对称的时候,均值是很好的对”集中趋势“的度量。根据样本量的大小,均值的置信区间可以用t分布或者z分布。
(2)基于中位数的
很多时候,数据本身的分布是不对称的,比如用户的网页结果的停留时长、用户点击的位置分布等。这个时候均值就不是一个很好的对总体集中趋势的估计了。实际中用的较多的是中位数。
但是中位数本身也存在一些问题。
(3) 基于几何均值的
可以参考 Sauro and Lewis 2010年的一篇论文。
这里简单说下论文的主要结论吧:
特定类型的数据(比如任务时长,用户在搜索结果的停留时间),要找到中位数的置信区间,中位数即p=0.5的那个分界点。其实相当于要找到p的置信区间。
得到置信区间[p1, p2]之后,去找到数据中位于[p1,p2]分界点的数据点即为中位数的置信区间了。
维基网络 https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Wilson_score_interval
https://indico.ihep.ac.cn/event/6182/contribution/4/material/slides/0.pdf