跳转到内容

S2 第五章:均匀分布

随机性的最纯粹形式:一个等可能性的世界

Section titled “随机性的最纯粹形式:一个等可能性的世界”

我们已经了解了指数分布描述的是”等待”的耐心数学,那么如果我们需要建模一种根本不同的情况——完全无知——该怎么办呢?

最大无知原则建议:把每个等长的区间视为等可能的。这自然引出了均匀分布——“纯粹随机性”的数学。

1.1 定义与概率密度函数——确定性的矩形

Section titled “1.1 定义与概率密度函数——确定性的矩形”

定义(连续均匀分布): 如果一个连续随机变量 XX 在区间 [a,b][a, b] 上具有恒定的概率密度,则称其服从该区间上的均匀分布。我们记作:

XUniform(a,b)XU(a,b)X \sim \text{Uniform}(a, b) \quad \text{或} \quad X \sim U(a, b)

关键洞见是”均匀”意味着恒定密度——想象一个完美平坦的矩形,其高度永不改变。

通过逻辑必然性推导 PDF:

由于分布是”均匀的”,PDF 在 [a,b][a, b] 上必须是某个常数 kk

f(x)={kif axb0otherwisef(x) = \begin{cases} k & \text{if } a \leq x \leq b \\ 0 & \text{otherwise} \end{cases}

但这个常数 kk 是多少呢?我们利用基本要求:总概率等于 1。

f(x)dx=abkdx=k(ba)=1\int_{-\infty}^{\infty} f(x) \, dx = \int_a^b k \, dx = k(b - a) = 1

因此:k=1bak = \frac{1}{b - a}

例 1:

考虑 XUniform(1,5)X \sim \text{Uniform}(1, 5)

(a) 写出 PDF 并画出草图

f(x)={151=14if 1x50otherwisef(x) = \begin{cases} \frac{1}{5-1} = \frac{1}{4} & \text{if } 1 \leq x \leq 5 \\ 0 & \text{otherwise} \end{cases}

这形成了一个从 x=1x = 1x=5x = 5、高度为 14\frac{1}{4} 的矩形。

(b) 求 P(2<X<3.5)P(2 < X < 3.5)

利用”矩形性质”:

P(2<X<3.5)=区间长度总长度=3.5251=1.54=0.375P(2 < X < 3.5) = \frac{\text{区间长度}}{\text{总长度}} = \frac{3.5 - 2}{5 - 1} = \frac{1.5}{4} = 0.375

(c) 求 P(X=3)P(X = 3)

对于任何连续分布:P(X=3)=0P(X = 3) = 0。单个点的概率为零。

(d) 求 P(X>4.5)P(X > 4.5)

P(X>4.5)=54.551=0.54=0.125P(X > 4.5) = \frac{5 - 4.5}{5 - 1} = \frac{0.5}{4} = 0.125

逐步构建 CDF:

对于 XUniform(a,b)X \sim \text{Uniform}(a, b),我们计算 F(x)=P(Xx)F(x) = P(X \leq x)

情况 1: x<ax < a

F(x)=0(尚未累积概率)F(x) = 0 \text{(尚未累积概率)}

情况 2: axba \leq x \leq b

F(x)=ax1badt=xaba(线性累积)F(x) = \int_a^x \frac{1}{b-a} dt = \frac{x-a}{b-a} \text{(线性累积)}

情况 3: x>bx > b

F(x)=1(全部概率已累积)F(x) = 1 \text{(全部概率已累积)}

均匀分布的 PDF 与 CDF

例 2:CDF 的应用

对于 XUniform(2,6)X \sim \text{Uniform}(-2, 6)

(a) 写出 CDF

F(x)={0if x<2x(2)6(2)=x+28if 2x61if x>6F(x) = \begin{cases} 0 & \text{if } x < -2 \\ \frac{x - (-2)}{6 - (-2)} = \frac{x + 2}{8} & \text{if } -2 \leq x \leq 6 \\ 1 & \text{if } x > 6 \end{cases}

(b) 求 P(0<X4)P(0 < X \leq 4)

P(0<X4)=F(4)F(0)=4+280+28=6828=12P(0 < X \leq 4) = F(4) - F(0) = \frac{4 + 2}{8} - \frac{0 + 2}{8} = \frac{6}{8} - \frac{2}{8} = \frac{1}{2}

(c) 求第一四分位数

Q1Q_1 满足 F(Q1)=0.25F(Q_1) = 0.25

Q1+28=0.25Q1+2=2Q1=0\frac{Q_1 + 2}{8} = 0.25 \Rightarrow Q_1 + 2 = 2 \Rightarrow Q_1 = 0

例 3:机场航班等候时间

某机场航班起飞之间的等候时间(分钟)由连续随机变量 XX 建模,其概率密度函数为

f(x)={152x70otherwisef(x) = \begin{cases} \frac{1}{5} & 2 \leq x \leq 7 \\ 0 & \text{otherwise} \end{cases}

  1. 写出这个分布的名称。
  2. 随机选取的一个航班在上午 9 点起飞。求下一班航班在上午 9:05 之前起飞的概率。
  3. 求接下来 5 个航班中至少有 1 个航班等候时间超过 6 分钟的概率。
  4. 对所有 xx,求 XX 的累积分布函数。
  5. 画出 XX2x72 \leq x \leq 7 上的累积分布函数草图。

1.3 数字特征——均值、方差与变换

Section titled “1.3 数字特征——均值、方差与变换”

对于连续随机变量,我们学过期望值就是”重心”。对于均匀分布,这个平衡点在哪里呢?

对于 XUniform(a,b)X \sim \text{Uniform}(a, b)

E(X)=abx1badx=1baabxdx=1bax22ab=b2a22(ba)=(ba)(b+a)2(ba)=a+b2\begin{aligned} E(X) &= \int_a^b x \cdot \frac{1}{b - a} \, dx = \frac{1}{b - a} \int_a^b x \, dx = \frac{1}{b - a} \cdot \frac{x^2}{2}\Big|_a^b = \frac{b^2 - a^2}{2(b - a)} = \frac{(b - a)(b + a)}{2(b - a)} = \frac{a + b}{2} \end{aligned}

美妙的对称性: 期望值恰好是区间的中点!

利用 Var(X)=E(X2)[E(X)]2\text{Var}(X) = E(X^2) - [E(X)]^2

第一步:计算 E(X2)E(X^2)

E(X2)=abx21badx=1bax33ab=b3a33(ba)=a2+ab+b23E(X^2) = \int_a^b x^2 \cdot \frac{1}{b - a} \, dx = \frac{1}{b - a} \cdot \frac{x^3}{3}\Big|_a^b = \frac{b^3 - a^3}{3(b - a)} = \frac{a^2 + ab + b^2}{3}

第二步:代入方差公式

Var(X)=a2+ab+b23(a+b2)2=(ba)212\text{Var}(X) = \frac{a^2 + ab + b^2}{3} - \left(\frac{a + b}{2}\right)^2 = \frac{(b - a)^2}{12}

例 4:参数关系

连续随机变量 XX 在区间 [a,β][a, \beta](其中 β>a\beta > a)上服从均匀分布。

已知 E(X)=8E(X) = 8

  1. 写出一个包含 aaβ\beta 的方程。

同时已知 P(X13)=0.7P(X \leq 13) = 0.7

  1. aaβ\beta 的值。
  2. Var(X)\text{Var}(X)
  3. P(5X35)P(5 \leq X \leq 35)

例 5:厨房秤

Albert 用厨房秤称量水果。随机变量 DD 表示秤显示的水果重量减去水果真实重量,单位为克。随机变量 DD 在区间 [2.5,2.5][-2.5, 2.5] 上服从均匀分布。

  1. 写出 DD 的概率密度函数。
  2. DD 的标准差。
  3. Albert 在秤上称一根香蕉。写出秤显示的重量恰好等于香蕉真实重量的概率。
  4. 求秤显示的重量在香蕉真实重量 1 克以内的概率。
  5. Albert 在秤上逐个称 10 根香蕉。求其中至少有 6 根香蕉的秤重在真实重量 1 克以内的概率。

练习 1:WST02/01/June17/7

连续随机变量 XX 在区间 [a,b][a, b] 上服从均匀分布。

  1. aabb 表示 E(32X)E(3 - 2X) 的表达式。(2)
  2. P(X>13b+23a)P(X > \frac{1}{3}b + \frac{2}{3}a)。(2)

已知 E(X)=0E(X) = 0

  1. 仅用 bb 表示 E(3X2)E(3X^2) 的表达式。(3)

同时已知 XX 的极差为 1818

  1. Var(X)\text{Var}(X)。(2)

练习 2:WST02/01/June15/3

一根意大利面长 2c2c,其中 cc 为正常数。它在随机位置被切成两段。连续随机变量 XX 表示较长段的长度,在区间 [c,2c][c, 2c] 上服从均匀分布。

  1. 画出 XX 的概率密度函数草图。(2)
  2. 用积分证明 Var(X)=c212\text{Var}(X) = \frac{c^2}{12}。(6)
  3. 求较长段长度超过较短段两倍的概率。(3)

练习 3:6684/01/June15/4

连续随机变量 LL 表示机器切割杆件时的误差(米)。LL 的分布是区间 [0,0.5][0, 0.5] 上的连续均匀分布。

  1. P(L<0.4)P(L < 0.4)。(1)
  2. 写出 E(L)E(L)。(1)
  3. 计算 Var(L)\text{Var}(L)。(2)

从此机器切割的杆件中随机抽取 3030 根作为样本。

  1. 求误差超过 0.40.4 米的杆件少于 44 根的概率。(3)

当一台新机器切割杆件时,误差 XX(米)由累积分布函数 F(x)F(x) 建模,其中

F(x)={0x<04x4x20x0.51otherwiseF(x) = \begin{cases} 0 & x < 0 \\ 4x - 4x^2 & 0 \leq x \leq 0.5 \\ 1 & \text{otherwise} \end{cases}

  1. 利用此模型,求 P(X>0.4)P(X > 0.4)。(2)

从此新机器切割的杆件中随机抽取 100100 根作为样本。

  1. 利用适当的近似方法,求其中至少 88 根杆件的误差超过 0.40.4 米的概率。(3)

现在我们将处理概率论中最著名的问题之一——它美妙地展示了均匀分布如何揭示 π\pi 本身的奥秘。

1777 年,法国数学家乔治-路易·勒克莱尔(蒲丰伯爵)提出了这个挑战:“随机投掷的针与平行线相交的概率是多少?”

蒲丰投针问题

提示 1: 考虑针相对于线条的位置。

XX 为针的中心到最近一条线的垂直距离。

问题 1a: 线间距为 1 个单位。XX(针中心到最近线的距离)的可能取值范围是多少?

答案:XX 的范围从 ____ 到 ____

问题 1b: 如果针是”随机”投掷的,XX 应该服从什么分布?

提示: 由于针是随机投掷的,它落在任何位置的可能性相同。这意味着 XX 在其范围内应该服从 ____ 分布。

问题 1c: 现在考虑针的方向。设 Θ\Theta 为针与平行线之间的锐角。Θ\Theta 的可能取值范围是多少?

答案:Θ\Theta 的范围从 ____ 到 ____

问题 1d: Θ\Theta 应该服从什么分布?

提示: 由于旋转对称性,针指向任何方向的可能性相同。所以 Θ\Theta 在其范围内应该服从 ____ 分布。

问题 1e: XXΘ\Theta 是否独立?

想一想: 针落在哪里会影响它的角度吗?角度会影响它落在哪里吗?你的答案:____

几何分析: 针在什么时候与线相交?

问题 2: 观察示意图。针从中心向每个方向延伸 12\frac{1}{2} 个单位。针在什么情况下与最近的线相交?找出函数 f(Θ)f(\Theta),使得针与线相交当且仅当 Xf(Θ)X \leq f(\Theta)

第三步:用”平均”法计算概率

Section titled “第三步:用”平均”法计算概率”

由于我们有两个随机方面(位置 XX 和角度 Θ\Theta),我们需要一种巧妙的方法。让我们一步步来思考:

关键洞见: 对于每个特定的角度 θ\theta,我们可以很容易地求出针与线相交的概率。然后对所有可能的角度进行”平均”。

问题 3a: 假设针的方向为特定角度 θ\theta(其中 0θπ20 \leq \theta \leq \frac{\pi}{2})。

  • 从第二步可知,针与线相交的条件是 XX \leq ____
  • 由于 XX[0,12][0, \frac{1}{2}] 上均匀分布,P(针与线相交角度=θ)P(\text{针与线相交} \mid \text{角度} = \theta) 是多少?

让我们通过一个例子来理解: 如果 θ=30=π6\theta = 30^{\circ} = \frac{\pi}{6},则:

  • 针与线相交的条件是 X12sin(π6)=12×12=14X \leq \frac{1}{2}\sin(\frac{\pi}{6}) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4}
  • 由于 XX[0,12][0, \frac{1}{2}] 上均匀分布:P(针与线相交θ=30)=1412=12P(\text{针与线相交} \mid \theta = 30^{\circ}) = \frac{\frac{1}{4}}{\frac{1}{2}} = \frac{1}{2}

一般公式: P(针与线相交角度=θ)=P(\text{针与线相交} \mid \text{角度} = \theta) = ____

问题 3b: 现在我们需要求总概率。由于角度 Θ\Theta 也是随机的且在 [0,π2][0, \frac{\pi}{2}] 上均匀分布,我们需要对问题 3a 中的条件概率在所有可能角度上进行”平均”。

数学上的平均: 当我们有一个连续的取值范围时,“平均”就变成了积分:

P(针与线相交)=1π200π/2P(针与线相交角度=θ)dθP(\text{针与线相交}) = \frac{1}{\frac{\pi}{2} - 0} \int_0^{\pi/2} P(\text{针与线相交} \mid \text{角度} = \theta) \, d\theta

将问题 3a 的答案代入此公式并计算积分。

逐步引导:

P(针与线相交)=1π20π/2___dθ=2π0π/2___dθ=___\begin{aligned} P(\text{针与线相交}) &= \frac{1}{\frac{\pi}{2}} \int_0^{\pi/2} \_\_\_ \, d\theta \\ &= \frac{2}{\pi} \int_0^{\pi/2} \_\_\_ \, d\theta \\ &= \_\_\_ \end{aligned}

问题 4a: 完成第三步的计算。你应该得到:

P(针与线相交)=___P(\text{针与线相交}) = \_\_\_

问题 4b: 看看你的答案!出现了什么著名的数学常数?这就是使蒲丰投针实验如此出名的惊人发现。

问题 4c: 重新排列你的概率公式,用相交概率来表示 π\pi

π=___\pi = \_\_\_

问题 4d: 你如何利用这个实验来估计 π\pi?如果你做了 1000 次实验并观察到 637 次相交,你对 π\pi 的估计值是多少?

你的计算:___.\text{你的计算:} \_\_\_.

拓展挑战:

  1. 如果针的长度不等于线间距会怎样?推导针长为 \ell、线间距为 dd 时的一般概率公式。
  2. 如果 >d\ell > d(针长于线间距),你将如何修改分析?
  3. 设计一个使用随手可得的材料(牙签、纸张等)的课堂实验来估计 π\pi