我们已经了解了指数分布描述的是”等待”的耐心数学,那么如果我们需要建模一种根本不同的情况——完全无知——该怎么办呢?
最大无知原则建议:把每个等长的区间视为等可能的。这自然引出了均匀分布——“纯粹随机性”的数学。
定义(连续均匀分布): 如果一个连续随机变量 X 在区间 [a,b] 上具有恒定的概率密度,则称其服从该区间上的均匀分布。我们记作:
X∼Uniform(a,b)或X∼U(a,b)
关键洞见是”均匀”意味着恒定密度——想象一个完美平坦的矩形,其高度永不改变。
通过逻辑必然性推导 PDF:
由于分布是”均匀的”,PDF 在 [a,b] 上必须是某个常数 k:
f(x)={k0if a≤x≤botherwise
但这个常数 k 是多少呢?我们利用基本要求:总概率等于 1。
∫−∞∞f(x)dx=∫abkdx=k(b−a)=1
因此:k=b−a1
例 1:
考虑 X∼Uniform(1,5)。
(a) 写出 PDF 并画出草图
f(x)={5−11=410if 1≤x≤5otherwise
这形成了一个从 x=1 到 x=5、高度为 41 的矩形。
(b) 求 P(2<X<3.5)
利用”矩形性质”:
P(2<X<3.5)=总长度区间长度=5−13.5−2=41.5=0.375
(c) 求 P(X=3)
对于任何连续分布:P(X=3)=0。单个点的概率为零。
(d) 求 P(X>4.5)
P(X>4.5)=5−15−4.5=40.5=0.125
逐步构建 CDF:
对于 X∼Uniform(a,b),我们计算 F(x)=P(X≤x):
情况 1: x<a
F(x)=0(尚未累积概率)
情况 2: a≤x≤b
F(x)=∫axb−a1dt=b−ax−a(线性累积)
情况 3: x>b
F(x)=1(全部概率已累积)

例 2:CDF 的应用
对于 X∼Uniform(−2,6):
(a) 写出 CDF
F(x)=⎩⎨⎧06−(−2)x−(−2)=8x+21if x<−2if −2≤x≤6if x>6
(b) 求 P(0<X≤4)
P(0<X≤4)=F(4)−F(0)=84+2−80+2=86−82=21
(c) 求第一四分位数
Q1 满足 F(Q1)=0.25:
8Q1+2=0.25⇒Q1+2=2⇒Q1=0
例 3:机场航班等候时间
某机场航班起飞之间的等候时间(分钟)由连续随机变量 X 建模,其概率密度函数为
f(x)={5102≤x≤7otherwise
- 写出这个分布的名称。
- 随机选取的一个航班在上午 9 点起飞。求下一班航班在上午 9:05 之前起飞的概率。
- 求接下来 5 个航班中至少有 1 个航班等候时间超过 6 分钟的概率。
- 对所有 x,求 X 的累积分布函数。
- 画出 X 在 2≤x≤7 上的累积分布函数草图。
对于连续随机变量,我们学过期望值就是”重心”。对于均匀分布,这个平衡点在哪里呢?
对于 X∼Uniform(a,b):
E(X)=∫abx⋅b−a1dx=b−a1∫abxdx=b−a1⋅2x2ab=2(b−a)b2−a2=2(b−a)(b−a)(b+a)=2a+b
美妙的对称性: 期望值恰好是区间的中点!
利用 Var(X)=E(X2)−[E(X)]2:
第一步:计算 E(X2)
E(X2)=∫abx2⋅b−a1dx=b−a1⋅3x3ab=3(b−a)b3−a3=3a2+ab+b2
第二步:代入方差公式
Var(X)=3a2+ab+b2−(2a+b)2=12(b−a)2
例 4:参数关系
连续随机变量 X 在区间 [a,β](其中 β>a)上服从均匀分布。
已知 E(X)=8:
- 写出一个包含 a 和 β 的方程。
同时已知 P(X≤13)=0.7:
- 求 a 和 β 的值。
- 求 Var(X)。
- 求 P(5≤X≤35)。
例 5:厨房秤
Albert 用厨房秤称量水果。随机变量 D 表示秤显示的水果重量减去水果真实重量,单位为克。随机变量 D 在区间 [−2.5,2.5] 上服从均匀分布。
- 写出 D 的概率密度函数。
- 求 D 的标准差。
- Albert 在秤上称一根香蕉。写出秤显示的重量恰好等于香蕉真实重量的概率。
- 求秤显示的重量在香蕉真实重量 1 克以内的概率。
- Albert 在秤上逐个称 10 根香蕉。求其中至少有 6 根香蕉的秤重在真实重量 1 克以内的概率。
练习 1:WST02/01/June17/7
连续随机变量 X 在区间 [a,b] 上服从均匀分布。
- 用 a 和 b 表示 E(3−2X) 的表达式。(2)
- 求 P(X>31b+32a)。(2)
已知 E(X)=0。
- 仅用 b 表示 E(3X2) 的表达式。(3)
同时已知 X 的极差为 18。
- 求 Var(X)。(2)
练习 2:WST02/01/June15/3
一根意大利面长 2c,其中 c 为正常数。它在随机位置被切成两段。连续随机变量 X 表示较长段的长度,在区间 [c,2c] 上服从均匀分布。
- 画出 X 的概率密度函数草图。(2)
- 用积分证明 Var(X)=12c2。(6)
- 求较长段长度超过较短段两倍的概率。(3)
练习 3:6684/01/June15/4
连续随机变量 L 表示机器切割杆件时的误差(米)。L 的分布是区间 [0,0.5] 上的连续均匀分布。
- 求 P(L<0.4)。(1)
- 写出 E(L)。(1)
- 计算 Var(L)。(2)
从此机器切割的杆件中随机抽取 30 根作为样本。
- 求误差超过 0.4 米的杆件少于 4 根的概率。(3)
当一台新机器切割杆件时,误差 X(米)由累积分布函数 F(x) 建模,其中
F(x)=⎩⎨⎧04x−4x21x<00≤x≤0.5otherwise
- 利用此模型,求 P(X>0.4)。(2)
从此新机器切割的杆件中随机抽取 100 根作为样本。
- 利用适当的近似方法,求其中至少 8 根杆件的误差超过 0.4 米的概率。(3)
现在我们将处理概率论中最著名的问题之一——它美妙地展示了均匀分布如何揭示 π 本身的奥秘。
1777 年,法国数学家乔治-路易·勒克莱尔(蒲丰伯爵)提出了这个挑战:“随机投掷的针与平行线相交的概率是多少?”

提示 1: 考虑针相对于线条的位置。
设 X 为针的中心到最近一条线的垂直距离。
问题 1a: 线间距为 1 个单位。X(针中心到最近线的距离)的可能取值范围是多少?
答案:X 的范围从 ____ 到 ____
问题 1b: 如果针是”随机”投掷的,X 应该服从什么分布?
提示: 由于针是随机投掷的,它落在任何位置的可能性相同。这意味着 X 在其范围内应该服从 ____ 分布。
问题 1c: 现在考虑针的方向。设 Θ 为针与平行线之间的锐角。Θ 的可能取值范围是多少?
答案:Θ 的范围从 ____ 到 ____
问题 1d: Θ 应该服从什么分布?
提示: 由于旋转对称性,针指向任何方向的可能性相同。所以 Θ 在其范围内应该服从 ____ 分布。
问题 1e: X 和 Θ 是否独立?
想一想: 针落在哪里会影响它的角度吗?角度会影响它落在哪里吗?你的答案:____
几何分析: 针在什么时候与线相交?
问题 2: 观察示意图。针从中心向每个方向延伸 21 个单位。针在什么情况下与最近的线相交?找出函数 f(Θ),使得针与线相交当且仅当 X≤f(Θ)。
由于我们有两个随机方面(位置 X 和角度 Θ),我们需要一种巧妙的方法。让我们一步步来思考:
关键洞见: 对于每个特定的角度 θ,我们可以很容易地求出针与线相交的概率。然后对所有可能的角度进行”平均”。
问题 3a: 假设针的方向为特定角度 θ(其中 0≤θ≤2π)。
- 从第二步可知,针与线相交的条件是 X≤ ____
- 由于 X 在 [0,21] 上均匀分布,P(针与线相交∣角度=θ) 是多少?
让我们通过一个例子来理解: 如果 θ=30∘=6π,则:
- 针与线相交的条件是 X≤21sin(6π)=21×21=41
- 由于 X 在 [0,21] 上均匀分布:P(针与线相交∣θ=30∘)=2141=21
一般公式: P(针与线相交∣角度=θ)= ____
问题 3b: 现在我们需要求总概率。由于角度 Θ 也是随机的且在 [0,2π] 上均匀分布,我们需要对问题 3a 中的条件概率在所有可能角度上进行”平均”。
数学上的平均: 当我们有一个连续的取值范围时,“平均”就变成了积分:
P(针与线相交)=2π−01∫0π/2P(针与线相交∣角度=θ)dθ
将问题 3a 的答案代入此公式并计算积分。
逐步引导:
P(针与线相交)=2π1∫0π/2___dθ=π2∫0π/2___dθ=___
问题 4a: 完成第三步的计算。你应该得到:
P(针与线相交)=___
问题 4b: 看看你的答案!出现了什么著名的数学常数?这就是使蒲丰投针实验如此出名的惊人发现。
问题 4c: 重新排列你的概率公式,用相交概率来表示 π:
π=___
问题 4d: 你如何利用这个实验来估计 π?如果你做了 1000 次实验并观察到 637 次相交,你对 π 的估计值是多少?
你的计算:___.
拓展挑战:
- 如果针的长度不等于线间距会怎样?推导针长为 ℓ、线间距为 d 时的一般概率公式。
- 如果 ℓ>d(针长于线间距),你将如何修改分析?
- 设计一个使用随手可得的材料(牙签、纸张等)的课堂实验来估计 π。