几何分布知识点整理

Posted on 2026-03-05 In COMP5270 Word count in article: 1.1k Reading time ≈ 4 mins.

几何分布知识点整理

主题：几何分布（Geometric Distribution）
适用场景：重复进行相互独立、成功概率不变的伯努利试验，关注“第一次成功何时出现”。

1. 前置概念：伯努利试验

几何分布建立在伯努利试验上，每次试验只有两种结果：

成功（概率为 \(p\)）
失败（概率为 \(1-p\)）

并且各次试验相互独立，\(p\) 不随轮次变化。

2. 两种常见定义（一定要分清）

几何分布有两种等价但“起点不同”的写法：

定义 A：\(X\) = 第一次成功发生在第几次试验（取值从 1 开始）

X{1,2,3,},P(X=n)=(1-p)^{n-1}p

直观解释：前 \(n-1\) 次都失败，第 \(n\) 次成功。

定义 B：\(Y\) = 第一次成功前失败了多少次（取值从 0 开始）

Y{0,1,2,},P(Y=k)=(1-p)^k p

两者关系：\(X=Y+1\)。

3. 分布函数（CDF）

对定义 A（\(X\)）

P(Xn)=1-(1-p)^n,n=1,2,

对定义 B（\(Y\)）

P(Yk)=1-(1-p)^{k+1},k=0,1,2,

4. 期望、方差

定义 A（从 1 开始）

E[X]=,(X)=

定义 B（从 0 开始）

E[Y]=,(Y)=

直觉：\(p\) 越小，成功越难，平均等待次数越大。

5. 为什么 \(E[X]=1/p\)、\(\mathrm{Var}(X)=(1-p)/p^2\)（推导）

这里采用定义 A：\(X\) 表示“第一次成功发生在第几次试验”，

\[ P(X=k)=(1-p)^{k-1}p,\quad k=1,2,3,\dots \]

5.1 期望推导

设 \(m=E[X]\)。按第一次试验分类：

以概率 \(p\) 成功：总次数是 \(1\)；
以概率 \(1-p\) 失败：已用 1 次，后续过程与原问题同分布，期望还要 \(m\) 次。

所以

\[ m=p\cdot 1+(1-p)\cdot(1+m) \]

化简：

\[ m=1+(1-p)m \]

\[ pm=1\Rightarrow m=\frac1p \]

即

\[ E[X]=\frac1p \]

5.2 方差推导

先求二阶矩 \(s=E[X^2]\)。同样按第一次试验分类：

成功（概率 \(p\)）：\(X=1\)，贡献 \(1^2\)；
失败（概率 \(1-p\)）：设后续等待为 \(X'\sim X\)，则 \(X=1+X'\)，

\[ X^2=(1+X')^2=1+2X'+(X')^2 \]

取期望得 \(1+2m+s\)。

于是

\[ s=p\cdot 1+(1-p)(1+2m+s) \]

化简：

\[ s=1+2(1-p)m+(1-p)s \]

\[ ps=1+2(1-p)m \]

代入 \(m=1/p\)：

\[ ps=1+\frac{2(1-p)}p=\frac{2-p}{p} \Rightarrow s=\frac{2-p}{p^2} \]

所以

\[ \mathrm{Var}(X)=E[X^2]-E[X]^2 =\frac{2-p}{p^2}-\frac{1}{p^2} =\frac{1-p}{p^2} \]

5.3 从 0 开始定义的结果

若 \(Y\) 表示“第一次成功前失败次数”，则 \(Y=X-1\)，因此

\[ E[Y]=E[X]-1=\frac{1-p}{p},\qquad \mathrm{Var}(Y)=\mathrm{Var}(X)=\frac{1-p}{p^2} \]

6. 无记忆性（几何分布最重要性质）

几何分布是唯一的离散无记忆分布。
对定义 A 可写成：

P(X>s+tX>s)=P(X>t),s,t

含义：已经连续失败了很多次，不会改变“未来还要等多久”的概率结构。

7. 与其他分布关系

与负二项分布：几何分布是“第 1 次成功”的负二项分布特例。
与指数分布：几何分布可看作指数分布在离散时间下的对应版本（都具有无记忆性）。

8. 典型例子

例：反复掷骰子，直到第一次出现 1

每次成功概率 \(p=1/6\)。若 \(X\)=首次出现 1 的投掷次数，则：

P(X=n)=()^{n-1}

平均需要：

E[X]==6

9. 易错点总结

先确认支持集：是从 1 开始还是从 0 开始。
参数统一：有些教材用 \(q\) 表示成功概率，有些用 \(p\)。
不要与超几何分布混淆：超几何分布是“有限总体不放回抽样”，机制完全不同。

10. 一页速记

PMF（从 1 开始）：\(P(X=n)=(1-p)^{n-1}p\)
PMF（从 0 开始）：\(P(Y=k)=(1-p)^k p\)
期望：\(E[X]=1/p\), \(E[Y]=(1-p)/p\)
方差：\((1-p)/p^2\)
核心性质：无记忆性

参考来源（在线）

Wikipedia (EN), Geometric distribution
https://en.wikipedia.org/wiki/Geometric_distribution
维基百科（中文）, 几何分布
https://zh.wikipedia.org/wiki/几何分布
Wolfram MathWorld, Geometric Distribution
https://mathworld.wolfram.com/GeometricDistribution.html