几何分布知识点整理

几何分布知识点整理

主题:几何分布(Geometric Distribution)
适用场景:重复进行相互独立、成功概率不变的伯努利试验,关注“第一次成功何时出现”。


1. 前置概念:伯努利试验

几何分布建立在伯努利试验上,每次试验只有两种结果:

  • 成功(概率为 \(p\)
  • 失败(概率为 \(1-p\)

并且各次试验相互独立,\(p\) 不随轮次变化。


2. 两种常见定义(一定要分清)

几何分布有两种等价但“起点不同”的写法:

定义 A:\(X\) = 第一次成功发生在第几次试验(取值从 1 开始)

$$

X{1,2,3,},P(X=n)=(1-p)^{n-1}p

$$

直观解释:前 \(n-1\) 次都失败,第 \(n\) 次成功。

定义 B:\(Y\) = 第一次成功前失败了多少次(取值从 0 开始)

$$

Y{0,1,2,},P(Y=k)=(1-p)^k p

$$

两者关系:\(X=Y+1\)


3. 分布函数(CDF)

对定义 A(\(X\)

$$

P(Xn)=1-(1-p)^n,n=1,2,

$$

对定义 B(\(Y\)

$$

P(Yk)=1-(1-p)^{k+1},k=0,1,2,

$$


4. 期望、方差

定义 A(从 1 开始)

$$

E[X]=,(X)=

$$

定义 B(从 0 开始)

$$

E[Y]=,(Y)=

$$

直觉:\(p\) 越小,成功越难,平均等待次数越大。


5. 为什么 \(E[X]=1/p\)\(\mathrm{Var}(X)=(1-p)/p^2\)(推导)

这里采用定义 A:\(X\) 表示“第一次成功发生在第几次试验”,

\[ P(X=k)=(1-p)^{k-1}p,\quad k=1,2,3,\dots \]

5.1 期望推导

\(m=E[X]\)。按第一次试验分类:

  • 以概率 \(p\) 成功:总次数是 \(1\)
  • 以概率 \(1-p\) 失败:已用 1 次,后续过程与原问题同分布,期望还要 \(m\) 次。

所以

\[ m=p\cdot 1+(1-p)\cdot(1+m) \]

化简:

\[ m=1+(1-p)m \]

\[ pm=1\Rightarrow m=\frac1p \]

\[ E[X]=\frac1p \]

5.2 方差推导

先求二阶矩 \(s=E[X^2]\)。同样按第一次试验分类:

  • 成功(概率 \(p\)):\(X=1\),贡献 \(1^2\)

  • 失败(概率 \(1-p\)):设后续等待为 \(X'\sim X\),则 \(X=1+X'\)

    \[ X^2=(1+X')^2=1+2X'+(X')^2 \]

    取期望得 \(1+2m+s\)

于是

\[ s=p\cdot 1+(1-p)(1+2m+s) \]

化简:

\[ s=1+2(1-p)m+(1-p)s \]

\[ ps=1+2(1-p)m \]

代入 \(m=1/p\)

\[ ps=1+\frac{2(1-p)}p=\frac{2-p}{p} \Rightarrow s=\frac{2-p}{p^2} \]

所以

\[ \mathrm{Var}(X)=E[X^2]-E[X]^2 =\frac{2-p}{p^2}-\frac{1}{p^2} =\frac{1-p}{p^2} \]

5.3 从 0 开始定义的结果

\(Y\) 表示“第一次成功前失败次数”,则 \(Y=X-1\),因此

\[ E[Y]=E[X]-1=\frac{1-p}{p},\qquad \mathrm{Var}(Y)=\mathrm{Var}(X)=\frac{1-p}{p^2} \]


6. 无记忆性(几何分布最重要性质)

几何分布是唯一的离散无记忆分布
对定义 A 可写成:

$$

P(X>s+tX>s)=P(X>t),s,t

$$

含义:已经连续失败了很多次,不会改变“未来还要等多久”的概率结构。


7. 与其他分布关系

  • 负二项分布:几何分布是“第 1 次成功”的负二项分布特例。
  • 指数分布:几何分布可看作指数分布在离散时间下的对应版本(都具有无记忆性)。

8. 典型例子

例:反复掷骰子,直到第一次出现 1

每次成功概率 \(p=1/6\)。若 \(X\)=首次出现 1 的投掷次数,则:

$$

P(X=n)=()^{n-1}

$$

平均需要:

$$

E[X]==6

$$


9. 易错点总结

  1. 先确认支持集:是从 1 开始还是从 0 开始。
  2. 参数统一:有些教材用 \(q\) 表示成功概率,有些用 \(p\)
  3. 不要与超几何分布混淆:超几何分布是“有限总体不放回抽样”,机制完全不同。

10. 一页速记

  • PMF(从 1 开始):\(P(X=n)=(1-p)^{n-1}p\)
  • PMF(从 0 开始):\(P(Y=k)=(1-p)^k p\)
  • 期望:\(E[X]=1/p\), \(E[Y]=(1-p)/p\)
  • 方差:\((1-p)/p^2\)
  • 核心性质:无记忆性

参考来源(在线)

  1. Wikipedia (EN), Geometric distribution
    https://en.wikipedia.org/wiki/Geometric_distribution
  2. 维基百科(中文), 几何分布
    https://zh.wikipedia.org/wiki/几何分布
  3. Wolfram MathWorld, Geometric Distribution
    https://mathworld.wolfram.com/GeometricDistribution.html