几何分布知识点整理
几何分布知识点整理
主题:几何分布(Geometric Distribution)
适用场景:重复进行相互独立、成功概率不变的伯努利试验,关注“第一次成功何时出现”。
1. 前置概念:伯努利试验
几何分布建立在伯努利试验上,每次试验只有两种结果:
- 成功(概率为 \(p\))
- 失败(概率为 \(1-p\))
并且各次试验相互独立,\(p\) 不随轮次变化。
2. 两种常见定义(一定要分清)
几何分布有两种等价但“起点不同”的写法:
定义 A:\(X\) = 第一次成功发生在第几次试验(取值从 1 开始)
$$
X{1,2,3,},P(X=n)=(1-p)^{n-1}p
$$
直观解释:前 \(n-1\) 次都失败,第 \(n\) 次成功。
定义 B:\(Y\) = 第一次成功前失败了多少次(取值从 0 开始)
$$
Y{0,1,2,},P(Y=k)=(1-p)^k p
$$
两者关系:\(X=Y+1\)。
3. 分布函数(CDF)
对定义 A(\(X\))
$$
P(Xn)=1-(1-p)^n,n=1,2,
$$
对定义 B(\(Y\))
$$
P(Yk)=1-(1-p)^{k+1},k=0,1,2,
$$
4. 期望、方差
定义 A(从 1 开始)
$$
E[X]=,(X)=
$$
定义 B(从 0 开始)
$$
E[Y]=,(Y)=
$$
直觉:\(p\) 越小,成功越难,平均等待次数越大。
5. 为什么 \(E[X]=1/p\)、\(\mathrm{Var}(X)=(1-p)/p^2\)(推导)
这里采用定义 A:\(X\) 表示“第一次成功发生在第几次试验”,
\[ P(X=k)=(1-p)^{k-1}p,\quad k=1,2,3,\dots \]
5.1 期望推导
设 \(m=E[X]\)。按第一次试验分类:
- 以概率 \(p\) 成功:总次数是 \(1\);
- 以概率 \(1-p\) 失败:已用 1 次,后续过程与原问题同分布,期望还要 \(m\) 次。
所以
\[ m=p\cdot 1+(1-p)\cdot(1+m) \]
化简:
\[ m=1+(1-p)m \]
\[ pm=1\Rightarrow m=\frac1p \]
即
\[ E[X]=\frac1p \]
5.2 方差推导
先求二阶矩 \(s=E[X^2]\)。同样按第一次试验分类:
成功(概率 \(p\)):\(X=1\),贡献 \(1^2\);
失败(概率 \(1-p\)):设后续等待为 \(X'\sim X\),则 \(X=1+X'\),
\[ X^2=(1+X')^2=1+2X'+(X')^2 \]
取期望得 \(1+2m+s\)。
于是
\[ s=p\cdot 1+(1-p)(1+2m+s) \]
化简:
\[ s=1+2(1-p)m+(1-p)s \]
\[ ps=1+2(1-p)m \]
代入 \(m=1/p\):
\[ ps=1+\frac{2(1-p)}p=\frac{2-p}{p} \Rightarrow s=\frac{2-p}{p^2} \]
所以
\[ \mathrm{Var}(X)=E[X^2]-E[X]^2 =\frac{2-p}{p^2}-\frac{1}{p^2} =\frac{1-p}{p^2} \]
5.3 从 0 开始定义的结果
若 \(Y\) 表示“第一次成功前失败次数”,则 \(Y=X-1\),因此
\[ E[Y]=E[X]-1=\frac{1-p}{p},\qquad \mathrm{Var}(Y)=\mathrm{Var}(X)=\frac{1-p}{p^2} \]
6. 无记忆性(几何分布最重要性质)
几何分布是唯一的离散无记忆分布。
对定义 A 可写成:
$$
P(X>s+tX>s)=P(X>t),s,t
$$
含义:已经连续失败了很多次,不会改变“未来还要等多久”的概率结构。
7. 与其他分布关系
- 与负二项分布:几何分布是“第 1 次成功”的负二项分布特例。
- 与指数分布:几何分布可看作指数分布在离散时间下的对应版本(都具有无记忆性)。
8. 典型例子
例:反复掷骰子,直到第一次出现 1
每次成功概率 \(p=1/6\)。若 \(X\)=首次出现 1 的投掷次数,则:
$$
P(X=n)=()^{n-1}
$$
平均需要:
$$
E[X]==6
$$
9. 易错点总结
- 先确认支持集:是从 1 开始还是从 0 开始。
- 参数统一:有些教材用 \(q\) 表示成功概率,有些用 \(p\)。
- 不要与超几何分布混淆:超几何分布是“有限总体不放回抽样”,机制完全不同。
10. 一页速记
- PMF(从 1 开始):\(P(X=n)=(1-p)^{n-1}p\)
- PMF(从 0 开始):\(P(Y=k)=(1-p)^k p\)
- 期望:\(E[X]=1/p\), \(E[Y]=(1-p)/p\)
- 方差:\((1-p)/p^2\)
- 核心性质:无记忆性
参考来源(在线)
- Wikipedia (EN), Geometric distribution
https://en.wikipedia.org/wiki/Geometric_distribution - 维基百科(中文), 几何分布
https://zh.wikipedia.org/wiki/几何分布 - Wolfram MathWorld, Geometric Distribution
https://mathworld.wolfram.com/GeometricDistribution.html