请输入您要查询的百科知识:

 

词条 二项式分布
释义

二项分布,伯努里分布:进行一系列试验,如果1.在每次试验中只有两种可能的结果,而且是互相对立的;2.每次实验是独立的,与其它各次试验结果无关;3.结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努力试验.在这试验中,事件发生的次数为一随机事件,它服从二次分布.二项分布可以用于可靠性试验.可靠性试验常常是投入n个相同的式样进行试验T小时,而只允许k个式样失败,应用二项分布可以得到通过试验的概率.

二项定义

一个事件必然出现,就说它100%要出现。100%=1,所以100%出现的含义就是出现的概率P=1。 即必然事件的出现概率为1。

若某事件概率为p,现重复试验n次,该事件发生k次的概率为:P=C(k,n)×p^k×(1-p)^(n-k).C(k,n)表示组合数,即从n个事物中拿出k个的方法数。

举例说明

如果掷一枚硬币,正面向上的结局的概率为0.5 。反面向上的结局的概率也是0.5 。那么出现正面向上事件或者反面向上事件的概率就是0.5+0.5=1 ,即二者必居其一。

如果掷两次硬币,根据独立事件的概率乘法定理那么两次都是正面(反面)向上的概率是0.5×0.5=0.25。另外第一个是正第二个是反的出现概率也是 0.5×0.5=0.25。同理第一个反第二个正的出现概率也是0.5×0.5=0.25。于是一正一反的概率是前面两个情况的和,即 0.25+0.25=2×0.25=0.5 。它们的合计值仍然是1。

两个正面的概率  一正一反的概率  两个反面的概率

0.25 2×0.25=0.5 0.25

代数计算

注意到代数学中 (a+b)^2=a^2+2ab+b^2, 而在a=0.5,b=0.5时,有 1^2=(0.5+0.5)^2=0.25+2×0.5×0.5+0.25=1。这说明掷两次硬币的各个结局的出现概率可以通过对二项式的平方展开而得到。

顺此,对于掷n次硬币的各种结局的出现概率也可以通过对二项式的n次方的展开而得到。例如n=3时,有(注意0.5×0.5×0.5=0.125) 1^3=(0.5+0.5)^3=0.125+3×0.125+3×0.125+0.125 = 0.125+0.375+0.375+0.125 = 1。

3个正面的概率 2正1反的概率 1正2反的概率 3个反面的概率

0.125 0.375 0.375 0.125

牛顿公式

二项式展开的牛顿公式表示为:

(a+b)^n=a^n + … + [n!/m!(n-m)!][a^(n-m)b^m]+ … + b^n (其中m=1,2,……n-1)。

即这种类型的问题(如掷多次硬币)的概率分布恰好可以用二项式展开的牛顿公式表示。而这也就是为什么把这种概率分布类型称为二项分布的原因。

如果a,b并不等于0.5,那么只要把A事件出现的概率以p代入,把B事件的出现概率以(1-p)代入,以上公式仍然正确,(a+b仍然=1)。所以对于仅有A,B两个结局的随机事件,如果A事件出现概率为p,B事件的出现概率为1-p,那么在n次随机实验中A事件出现n-m次、B事件出现m次的情况(对应一种复合事件)的出现概率P应当是(这里的P是大写的):

P=[n!/m!(n-m)!][p^(n-m) (1-p)^m] (其中m=0,1,……,n)

注意到上面公式的对称性,它也可以写为 P=[n!/m!(n-m)!][p^m (1-p)^(n-m)]。它就是所谓二项分布概型的随机事件的出现概率公式,也是牛顿二项式展开在变量为对应概率值的情况下的通项。

二项分布

若某事件概率为p,现重复试验n次,该事件发生k次的概率为:P=C(k,n)×p^k×(1-p)^(n-k).C(k,n)表示组合数,即从n个事物中拿出k个的方法数.

二项分布概念

在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。

考虑只有两种可能结果的随机试验,当成功的概率(π)是恒定的,且各次试验相互独立,这种试验在统计学上称为贝努里试验(Bernoulli trial)。如果进行n次贝努里试验,取得成功次数为X(X=0,1,…,n)的概率可用下面的二项分布概率公式来描述:

(7.1)

式中的n为独立的贝努里试验次数,π为成功的概率,(1-π)为失败的概率,X为在n次贝努里试验中出现成功的次数,表示在n次试验中出现X的各种组合情况,在此称为二项系数(binomial coefficient)。

所以的含义为:含量为n的样本中,恰好有例阳性数的概率。

含量为n的样本中,发生各种阳性数的概率正好为下列二项式展开的各项

(7.2)

式中,π为总体阳性率;n为样本含量;X为阳性数;(nX)为组合数,即二项式展开后各项的系数。

二项分布应用条件

1.各观察单位只能具有相互对立的一种结果,如阳性或阴性,生存或死亡等,属于两分类资料。

2.已知发生某一结果(阳性)的概率为π,其对立结果的概率为1-π,实际工作中要求π是从大量观察中获得比较稳定的数值。

3.n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。如要求疾病无传染性、无家族性等。

二项分布性质

1.二项分布的均数和标准差在二项分布资料中,当π和n已知时,它的均数μ及其标准差σ可由式(7.3)和(7.4)算出。

μ=nπ(7.3)

σ=(7.4)

若均数和标准差不用绝对数表示,而是用率表示时,即对式(7.3)和(7.4)分别除以n,得

μp=π(7.5)

σp=(7.6)

σp是样本率的标准误的理论值,当π未知时,常用样本率p作为π的估计值,式(7.6)变为:

sp= (7.7)

2.二项分布的累计概率(cumulative probability)常用的有左侧累计和右侧累计两种方法。从阳性率为π的总体中随机抽取含量为n的样本,则

(1)最多有k例阳性的概率

(7.8)

(2)最少有k例阳性的概率

(7.9)

其中,X=0,1,2,…,k,…,n。

3.二项分布的图形已知π和n,就能按公式计算X=0,1,…,n时的P(X)值。以X为横坐标,以P(X)为纵坐标作图,即可绘出二项分布的图形,如图7.1,给出了p=0.5和 p=0.3时不同n值对应的二项分布图。

二项分布的形状取决于π和n的大小,高峰在m=np处。当p接近0.5时,图形是对称的;p离0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。当n→∞时,只要p不太靠近0或1,特别是当nP和n(1-P)都大于5时,二项分布近似于正态分布。

π=0.5时,不同n值对应的二项分布

π=0.3时, 不同n值对应的二项分布

两点分布的分布列就是

X 0 1

P p 1-p

不论题目有什么区别,只有两种可能,要么是这种结果要么是那种结果,通俗点,要么成功要么失败

而二项分布的可能结果是不确定的甚至是没有尽头的,

列一个二项分布的分布列就是

X 0 1 2 ……… n

P C(0)(n)·(1-p)^n C(1)(n)·p·(1-p)^(n-1) …… C(n)(n)·p^n·(1-p)^0

也就是说当n=1时,这个特殊二项分布就会变成两点分布,

即两点分布是一种特殊的二项分布

像一楼说的二项分布是两点分布的多重实验也不无道理,因为两者都是独立的重复实验,只不过次数不同罢了

E(n) = np, var(n) = np(1-p) (n是实验次数,p是每次实验的概率)

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/1/5 23:22:50