词条 | 点估计 |
释义 | § 简介 参数估计的一种形式。目的是依据样本X=(X1,X2,…,Xn)估计总体分布所含的未知参数θ或θ的函数 g(θ)。一般θ或g(θ)是总体的某个特征值,如数学期望、方差、相关系数(见相关分析)等。θ或 g(θ)通常取实数或k维实向量为值。点估计问题就是要构造一个只依赖于样本X的量抭(X),作为g(θ)的估计值。抭(X)称为g(θ)的估计量。因为k维实向量可表为k维欧几里得空间的一个点,故称这样的估计为点估计。 例如,设一批产品的废品率为θ,为估计θ,从这批产品中随机地抽出 n个作检查,以X 记其中的废品个数,用 X/n估计θ,就是一个点估计。又如用样本方差(见统计量)估计总体分布的方差,或用样本相关系数估计总体分布的相关系数,都是常见的点估计。 点估计 § 构造点估计的方法 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。这里仅介绍最为简单、直观又常用的矩估计法。 在统计学中,矩是指以期望为基础而定义的数字特征,一般分为原点矩和中心矩。 设X为随机变量,对任意正整数k,称E(Xk)为随机变量X的k阶原点矩,记为: mk = E(Xk) 当k=1时, m1 = E(X) = μ 可见一阶原点矩为随机变量X的数学期望。 我们把Ck = E[X − E(X)]k称为以E(X)为中心的k阶中心矩。 显然,当k=2时, C2 = E[X − E(X)]2 = σ2 可见二阶中心矩为随机变量X的方差。 § 常见方法 矩估计法 这是英国统计学家К.皮尔森在1894年提出的方法,其要旨是用样本矩的函数估计总体矩的同一函数。例如,若总体分布服从正态分布 N(μ,σ2),其中μ是总体均值,σ2是总体方差,未知参数可记为θ=(μ,σ)。σ/μ(μ≠0)称为变异系数,它是总体的一阶原点矩(即均值)μ与二阶中心矩(即方差)σ2的函数。设有样本X=(X1,X2,…,Xn),其一阶样本原点矩为,二阶样本中心矩为,而用估计 σ/μ,就是一个典型的矩估计方法。 最大似然估计法 此法作为一种重要而普遍的点估计法,由英国统计学家R.A.费希尔在1912年提出。后来在他1921年和1925年的工作中又加以发展。设样本X=(X1,X2,…,Xn)的分布密度为L(X,θ),若固定X而将L视为θ的函数,则称为似然函数,当X是简单随机样本时,它等于ƒ(X1,θ)ƒ(X2,θ)…ƒ(Xn,θ),其中,ƒ(X,θ)是总体分布的密度函数或概率函数(见概率分布)。一经得到样本值x,就确定(x),使 ,然后用估计g(θ),这就是g(θ)的最大似然估计。例如,不难证明,前面为估计正态分布N(μ,σ2)中的参数μ和σ2而提出的估计量和2,就是μ和σ2的最大似然估计。 最小二乘估计法 这个重要的估计方法是由德国数学家C.F.高斯在1799~1809年和法国数学家A.-M.勒让德在1806年提出,并由俄国数学家Α.Α.马尔可夫在1900年加以发展。它主要用于线性统计模型中的参数估计问题。 贝叶斯估计法 是基于“贝叶斯学派”的观点而提出的估计法(见贝叶斯统计)。 小样本优良性准则 可以用来估计g(θ)的估计量很多,于是产生了怎样选择一个优良估计量的问题。首先必须对“优良性”定出准则。这种准则不是惟一的,它可以根据问题的实际背景和理论上的方便进行选择。优良性准则有两大类:一类是小样本准则,即在样本大小固定时的优良性准则;另一类是大样本准则,即在样本大小趋于无穷时的优良性准则。最重要的小样本优良性准则是无偏性及与此相关的一致最小方差无偏估计。若一个估计量抭(X)的数学期望等于被估计的g(θ),即对一切θ,,则称抭(X)为g(θ)的无偏估计,这种估计的特点是:在多次重复使用时, 抭(X)与g(θ)的偏差的算术平均值随使用次数的增加而趋于零。因此,无偏性只在重复使用中,并且各次误差能相互抵消时,才显出其意义。无偏估计并不总是存在。例如,设总体服从二项分布B(n,θ),0<θ<1,则1/θ的无偏估计就不存在。有时,无偏估计虽然存在,但很不合理。在一些问题中,无偏估计有很多,它们的优良性由其方差来衡量,方差愈小愈好。若一无偏估计的方差比任何别的无偏估计的方差都小,或至多相等,则称它为一致最小方差无偏估计。寻找一致最小方差无偏估计的一个普遍方法,是D.布莱克韦尔、E.L.莱曼和H.谢菲在1950年提出的,它基于统计量的充分性与完全性的概念:设抭(X)是一个无偏估计,T是一个完全充分统计量,则抭(X)在给定T时的条件期望就是一个一致最小方差无偏估计。 克拉默-拉奥不等式是寻求一致最小方差无偏估计的另一重要工具,是由印度统计学家C.R.拉奥和瑞典统计学家H.克拉默在1945年和1946年先后独立地证明的。当样本的似然函数 L(X,θ)满足一定条件时,则 g(θ)的任一无偏估计 抭(X)的方差 ,对于一切θ满足不等式这个不等式的右边只与样本的分布及待估函数 g有关,而与抭(X)无关。通常称这个不等式为克拉默-拉奥不等式,或C-R不等式。它的右边给出了 g(θ)的无偏估计的方差的最小下界,称为克拉默-拉奥下界或C-R下界。因此,若某一无偏估计的方差达到上述C-R下界,则它必是一致最小方差无偏估计。C-R不等式在其他统计问题中也有应用。 在点估计问题中还使用其他一些小样本准则,如容许性准则、最小化最大准则、最优同变准则(见统计决策理论)等。 § 大样本优良性准则 样本统计量,如样本均值 ,样本标准差S,样本成数如何用于对相应总体参数μ、σ和p的点估计值。直观上,这些样本统计量对相应总体参数的点估计值是很有吸引力的。然而,在用一个样本统计量作为点估计量之前,统计学应检验说明这些样本统计量是否具有某些与好的点估计量相联系的性质。本节我们讨论好的点估计量的性质:无偏性、有效性和一致性。 由于有许多不同的样本统计量用作总体不同参数的点估计量,本节我们采用如下的一般记号。 θ——所感兴趣的总体参数 ——样本统计量或θ的点估计量 θ代表一总体的参数,如总体均值、总体标准差和总体比率等等;代表相应的样本统计量,如样本均值、样本标准差和样本比率。 1、无偏性 如果样本统计量的数学期望等于所估计的总体参数的值,该样本统计量称作总体参数的无偏估计量。无偏性的定义如下: 如果 则称样本统计量是总体参数θ的无偏估计。 式中——样本统计量的数学期望 因此,样本无偏统计量的所有可能值的期望值或均值等于被估计的总体参数。 2、有效性 假定含n个元素的一个简单随机样本用于给出同一总体参数的两个不同的无偏点估计量。这时,我们偏好于用标准差较小的点估计量,因为它给出的估计值与总体参数更接近。有较小标准差的点估计量称作比其他点估计量有更好的相对效率。 3、一致性 与一个好的点估计相联系的第三个性质为一致性。粗略地讲,如果当样本容量更大时,点估计量的值更接近于总体参数,该点估计量是一致的。换言之,大样本比小样本趋于接进一个更好的点估计。注意到对样本均值,我们证明标准差。由于与样本容量相关,较大的样本容量得到的\\sigma_{\\bar{x}}的值更小,我们得出大样本容量趋于给出的点估计更接近于总体均值μ。在这个意义上,我们可以说样本均值是总体均值μ的一个一致估计量。 但由于在实际抽样调查中一次只是随机抽取一个样本,导致估计值会因样本的不同而不同,甚至产生很大的差异。所以说,点估计是一种的估计或推断,其缺点是既没有解决参数估计的精确问题,也没有考虑估计的可靠性程度,只有区间估计才能解决这两个问题。不过,由于点估计直观、简单,对于那些要求不太高的判断和分析,可以使用此种方法 § 参考书目 H.克拉默著,魏宗舒等译:《统计学数学方法》,上海科学技术出版社,上海,1966。(H.Cramér,MatheMatical Methods of Statistics,Princeton Univ. Press,Princeton, 1946.) 成平等著:《参数估计》,上海科学技术出版社,上海,1985。 § 配图 § 相关连接 |
随便看 |
百科全书收录594082条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。