词条 | 序贯分析 |
释义 | 序贯分析(sequential analysis) 数理统计学的一个分支。其名称源出于美国统计学家瓦尔德在1947年发表的一本同名著作。 简介序贯分析,数理统计学的一个分支,其名称源出于A.瓦尔德在1947年发表的一本同名著作,它研究的对象是所谓“序贯抽样方案”,及如何用这种抽样方案得到的样本去作统计推断。 序贯抽样方案是指在抽样时,不事先规定总的抽样个数(观测或实验次数),而是先抽少量样本,根据其结果,再决定停止抽样或继续抽样、抽多少,这样下去,直至决定停止抽样为止。反之,事先确定抽样个数的那种抽样方案,称为固定抽样方案。 它研究的对象是所谓“序贯抽样方案”,及如何用这种抽样方案得到的样本去作统计推断。美国统计学家道奇和罗米格的二次抽样方案是较早的一个序贯抽样方案。1945年,施坦针对方差未知时估计和检验正态分布的均值的问题,也提出了一个二次抽样方案,据此序贯抽样方案既可节省抽样量,又可达到预定的推断可靠程度及精确程度。第二次世界大战时,为军需验收工作的需要,瓦尔德发展了一种一般性的序贯检验方法,叫做序贯概率比检验,此法在他的1947年的著作中有系统的介绍。瓦尔德的这种方法提供了根据各次观测得到的样本值接受原假设H0或接受备择假设H1的临界值的近似公式,也给出了这种检验法的平均抽样次数和功效函数,并在1948年与美国统计学家沃尔福威兹一起,证明了在一切两种错误概率分别不超过α和β的检验类中,上述序贯概率比检验所需平均抽样次数最少。瓦尔德在其著作中也考虑了复合检验的问题,有许多统计学者研究了这种检验。瓦尔德的上述开创性工作引起了许多统计学者对序贯方法的注意,并继续进行工作,从而使序贯分析形成为数理统计学的一个分支。除了检验问题以外,序贯方法在其他方面也有不少应用,如在一般的统计决策、点佑计、区间估计等方面都有不少工作。 历史第二次世界大战时,为军需验收工作的需要,瓦尔德发展了一种一般性的序贯检验方法,叫序贯概率比检验(简称SPRT)。此法在他的1947年的著作中有系统介绍,其要点如下:设在原假设H0和备择假设H1之下,随机变量x的概率密度函数或概率函数随机变量都已知,且分别为p0(x)及p1(x),对x逐次观测,第i次观测的结果记为xi,称比值 为 样本x1, x2,…, xn的概率比。在固定抽样方案之下,是先给定自然数n,对x进行n次观测得x1,x2,…,xn,计算。定出一常数C(其值取决于检验水平α),当λn≤C 时,接受原假设H0,否则拒绝H0。这样,在λn的值 与C很接近时,H0是否被接受的界限过于断然,不大合理。瓦尔德将此修改为:指定两个数A,B,A<B,根据各次观测得的样本x1,x2,…的值,依次计算概率比λ1,λ2,…。每次抽样完毕,即算出λn,再与A,B比较,若λn≤A,则接受H0;若λn≥B,则接收H1(拒绝H0);若A<λn<B,则继续抽样一次得xn+1,计算出xn+1再作上述比较,直到作出决定为止。这就是序贯概率比检验。至于A,B的定法,则取决于指定的两种错误概率α和β(α,β都大于0,但很小)。瓦尔德提供的近似公式是A=β/(1-α),B=(1-β)/ α。他也给出了这种检验法的平均抽样次数和功效函数(见假设检验),并在1948年与美国统计学家J.沃尔弗维茨一起,证明了在一切两种错误概率分别不超过α和β的检验类中,上述序贯概率比检验所需平均抽样次数最少。瓦尔德在其著作中也考虑了复合检验的问题,有许多统计学者研究了这种检验。瓦尔德的上述开创性工作,引起了许多统计学者对序贯方法的注意,并继续进行工作,从而使序贯分析形成为数理统计学的一个分支。 除了检验问题以外,序贯方法在其他方面也有不少进展,对一般的统计决策问题,在各次观测结果相互独立的情况下的序贯贝叶斯解的问题,在理论上已有较完整的结果。在点估计方面,对序贯的最小化最大估计的研究有了一些结果。在区间估计方面,关于斯坦的二次抽样,正态均值及一般总体均值和线性模型参数的区间估计,有不少的工作。另外,在数理统计学中有一类在应用上重要的问题,叫选择问题,它要求从若干个分布中挑选出一个在某种意义上的最优者。例如,从若干个具有不同均值的正态分布中,挑选出其均值最大者。关于这个问题也发展了一系列的序贯方法。 举例一个产品抽样检验方案规定按批抽样品20件,若其中不合格品件数不超过 3,则接收该批,否则拒收。在此,抽样个数20是预定的,是固定抽样。若方案规定为:第一批抽出3个,若全为不合格品,拒收该批,若其中不合格品件数为x1<3,则第二批再抽3-x1个,若全为不合格品,则拒收该批,若其中不合格品数为 x2<3-x1,则第三批再抽3-x1-x2个,这样下去,直到抽满20件或抽得 3个不合格品为止。这是一个序贯抽样方案,其效果与前述固定抽样方案相同,但抽样个数平均讲要节省些。此例中,抽样个数是随机的,但有一个不能超过的上限20。有的序贯抽样方案,其可能抽样个数无上限,例如,序贯概率比检验的抽样个数就没有上限。 H.F.道奇和 H.G.罗米格的二次抽样方案(见抽样检验)是较早的一个序贯抽样方案。1945年,C.施坦针对方差未知时估计和检验正态分布的均值 μ(见数学期望)的问题,提出了一个二次抽样方案。依此方案,在事先给定了l>0和0<α<1后,可作出均值μ的一个置信区间,其置信系数(见区间估计)为1-α ,而长度不超过l。可以证明:当方差未知时,具有这种性质的置信区间在固定样本的情况下不可能找到。由此可以看出序贯抽样方案除了可节省抽样量之外,还有一种作用,即为了达到预定的推断可靠程度(这里为置信系数)及精确程度(这里是以区间长度来刻画),有时必须使用序贯抽样。例如,估计一事件A的概率p(0<p<1),给定ε>0及0<α<1,要找到这样的估计孨,使能以不小于1-α 的概率保证估计的相对误差|(孨-p)/p|≤ε。可以证明,若用固定抽样方案,事先指定自然数n,做n次试验,每次观察A是否发生,则不论n多么大,具有上述性质的孨不存在。但用下述序贯抽样方案可得到这样的孨:作试验,观察A是否发生,设到A第一次发生时已作了n1次试验,计算出,取其整数部分n2,再作n2次试验,记n2次试验中A出现的次数为m,令孨=m/n2,则有p(|孨-p|/p≤ε)≥1-α ,而估计孨具有所指定的性质。 相关介绍数理统计学 基本简介莱尔根据各个地层中的化石种类和现仍在海洋中生活的种类作出百分率,然后定出更新世、上新世、中新世、始新世的名称。并于1830~1833年出版了三卷《地质学原理》。这些地质学中的名称沿用至今,可是他使用的类似于现在数理统计的方法,却没有引起人们的重视。 生物学家达尔文关于进化论的工作主要是生物统计的,他在乘坐“贝格尔”号军舰到美洲的旅途上带着莱尔的上述著作,二者看来不无关系。 从数学上对生物统计进行研究的第一人是英国统计学家皮尔逊,他曾在伦敦大学学院学习,然后去德国学物理,1881年在剑桥大学获得学士学位,1882年任伦敦大学应用数学力学教授。 具体地说与人们生活有关的如某种食品营养价值高低的调查;通过用户对家用电器性能指标及使用情况的调查,得到全国某种家用电器的上榜品牌排名情况;一种药品对某种疾病的治疗效果的观察评价等都是利用数理统计方法来实现的。 飞机、舰艇、卫星、电脑及其它精密仪器的制造需要成千上万个零部件来完成,而这些零件的寿命长短,性能好坏均要用数理统计的方法进行检验才能获得。 在经济领域,从某种商品未来的销售情况预测到某个城市整个商业销售的预测,甚至整个国家国民经济状况预测及发展计划的制定都要用到数理统计知识。 数理统计用处之大不胜枚举。可以这么说,现代人的生活、科学的发展都离不开数理统计。从某种意义上来讲,数理统计在一个国家中的应用程度标志着这个国家的科学水平。 难怪在谈到数理统计的应用时,有人称赞它的用途像水银落地是无孔不入的,这恐怕并非言过其实。 发展历程数理统计学是伴随着概率论的发展而发展起来的。19世纪中叶以前已出现了若干重要的工作,如C.F.高斯和A.M.勒让德关于观测数据误差分析和最小二乘法的研究。到19世纪末期,经过包括K.皮尔森在内的一些学者的努力,这门学科已开始形成。但数理统计学发展成一门成熟的学科,则是20世纪上半叶的事,它在很大程度上要归功于K.皮尔森、R.A.费希尔等学者的工作。特别是费希尔的贡献,对这门学科的建立起了决定性的作用。1946年H.克拉默发表的《统计学数学方法》是第一部严谨且比较系统的数理统计著作,可以把它作为数理统计学进入成熟阶段的标志。数理统计学的发展大致可分3个时期。 第一时期:20 世纪以前。这个时期又可分成两段,大致上可以把高斯和勒让德关于最小二乘法用于观测数据的误差分析的工作作为分界线,前段属萌芽时期,基本上没有超出描述性统计量的范围。后一阶段可算作是数理统计学的幼年阶段。首先,强调了推断的地位,而摆脱了单纯描述的性质。由于高斯等的工作揭示了正态分布的重要性,学者们普遍认为,在实际问题中遇见的几乎所有的连续变量,都可以满意地用正态分布来刻画。这种观点使关于正态分布的统计得到了深入的发展,但延缓了非参数统计的发展。19世纪末,K.皮尔森给出了以他的名字命名的分布,并给出了估计参数的一种方法——矩法估计。德国的F.赫尔梅特发现了统计上十分重要的x2 分布。 第二时期:20世纪初到第二次世界大战结束。这是数理统计学蓬勃发展达到成熟的时期。许多重要的基本观点和方法,以及数理统计学的主要分支学科,都是在这个时期建立和发展起来的。这个时期的成就,包含了至今仍在广泛使用的大多数统计方法。在其发展中,以英国统计学家、生物学家费希尔为代表的英国学派起了主导作用。 第三时期:战后时期。这一时期中,数理统计学在应用和理论两方面继续获得很大的进展。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。