跳转到内容

S2 第五章:均匀分布

随机性的最纯粹形式:一个等可能性的世界

Section titled “随机性的最纯粹形式:一个等可能性的世界”

我们已经了解了指数分布描述的是”等待”的耐心数学,那么如果我们需要建模一种根本不同的情况——完全无知——该怎么办呢?

最大无知原则建议:把每个等长的区间视为等可能的。这自然引出了均匀分布——“纯粹随机性”的数学。

1.1 定义与概率密度函数——确定性的矩形

Section titled “1.1 定义与概率密度函数——确定性的矩形”

定义(连续均匀分布): 如果一个连续随机变量 XX 在区间 [a,b][a, b] 上具有恒定的概率密度,则称其服从该区间上的均匀分布。我们记作:

XUniform(a,b)XU(a,b)X \sim \text{Uniform}(a, b) \quad \text{或} \quad X \sim U(a, b)

关键洞见是”均匀”意味着恒定密度——想象一个完美平坦的矩形,其高度永不改变。

通过逻辑必然性推导 PDF:

由于分布是”均匀的”,PDF 在 [a,b][a, b] 上必须是某个常数 kk

k & \text{if } a \leq x \leq b \\ 0 & \text{otherwise} \end{cases}$$ 但这个常数 $k$ 是多少呢?我们利用基本要求:总概率等于 1。 $$\int_{-\infty}^{\infty} f(x) \, dx = \int_a^b k \, dx = k(b - a) = 1$$ 因此:$k = \frac{1}{b - a}$ :::note[均匀分布的 PDF] 对于 $X \sim \text{Uniform}(a, b)$: $$f(x) = \begin{cases} \frac{1}{b - a} & \text{if } a \leq x \leq b \\ 0 & \text{otherwise} \end{cases}$$ **几何解释:** 这形成了一个宽度为 $(b-a)$、高度为 $\frac{1}{b-a}$ 的矩形,面积为 1。 ::: **例 1:** 考虑 $X \sim \text{Uniform}(1, 5)$。 **(a) 写出 PDF 并画出草图** $$f(x) = \begin{cases} \frac{1}{5-1} = \frac{1}{4} & \text{if } 1 \leq x \leq 5 \\ 0 & \text{otherwise} \end{cases}$$ 这形成了一个从 $x = 1$ 到 $x = 5$、高度为 $\frac{1}{4}$ 的矩形。 **(b) 求 $P(2 < X < 3.5)$** 利用"矩形性质": $$P(2 < X < 3.5) = \frac{\text{区间长度}}{\text{总长度}} = \frac{3.5 - 2}{5 - 1} = \frac{1.5}{4} = 0.375$$ **(c) 求 $P(X = 3)$** 对于任何连续分布:$P(X = 3) = 0$。单个点的概率为零。 **(d) 求 $P(X > 4.5)$** $$P(X > 4.5) = \frac{5 - 4.5}{5 - 1} = \frac{0.5}{4} = 0.125$$ ### 1.2 累积分布函数——线性攀升 **逐步构建 CDF:** 对于 $X \sim \text{Uniform}(a, b)$,我们计算 $F(x) = P(X \leq x)$: **情况 1:** $x < a$ $$F(x) = 0 \text{(尚未累积概率)}$$ **情况 2:** $a \leq x \leq b$ $$F(x) = \int_a^x \frac{1}{b-a} dt = \frac{x-a}{b-a} \text{(线性累积)}$$ **情况 3:** $x > b$ $$F(x) = 1 \text{(全部概率已累积)}$$ :::note[均匀分布的 CDF] 对于 $X \sim \text{Uniform}(a, b)$: $$F(x) = \begin{cases} 0 & \text{if } x < a \\ \frac{x - a}{b - a} & \text{if } a \leq x \leq b \\ 1 & \text{if } x > b \end{cases}$$ **关键性质:** - $F(\frac{a+b}{2}) = 0.5$(中位数始终在中心) ::: **例 2:CDF 的应用** 对于 $X \sim \text{Uniform}(-2, 6)$: **(a) 写出 CDF** $$F(x) = \begin{cases} 0 & \text{if } x < -2 \\ \frac{x - (-2)}{6 - (-2)} = \frac{x + 2}{8} & \text{if } -2 \leq x \leq 6 \\ 1 & \text{if } x > 6 \end{cases}$$ **(b) 求 $P(0 < X \leq 4)$** $$P(0 < X \leq 4) = F(4) - F(0) = \frac{4 + 2}{8} - \frac{0 + 2}{8} = \frac{6}{8} - \frac{2}{8} = \frac{1}{2}$$ **(c) 求第一四分位数** $Q_1$ 满足 $F(Q_1) = 0.25$: $$\frac{Q_1 + 2}{8} = 0.25 \Rightarrow Q_1 + 2 = 2 \Rightarrow Q_1 = 0$$ **例 3:机场航班等候时间** 某机场航班起飞之间的等候时间(分钟)由连续随机变量 $X$ 建模,其概率密度函数为 $$f(x) = \begin{cases} \frac{1}{5} & 2 \leq x \leq 7 \\ 0 & \text{otherwise} \end{cases}$$ 1. 写出这个分布的名称。 2. 随机选取的一个航班在上午 9 点起飞。求下一班航班在上午 9:05 之前起飞的概率。 3. 求接下来 5 个航班中至少有 1 个航班等候时间超过 6 分钟的概率。 4. 对所有 $x$,求 $X$ 的累积分布函数。 5. 画出 $X$ 在 $2 \leq x \leq 7$ 上的累积分布函数草图。 ### 1.3 数字特征——均值、方差与变换 #### 从矩形到平衡点:自然的中心 对于连续随机变量,我们学过期望值就是"重心"。对于均匀分布,这个平衡点在哪里呢? 对于 $X \sim \text{Uniform}(a, b)$:

\begin{aligned} E(X) &= \int_a^b x \cdot \frac{1}{b - a} , dx = \frac{1}{b - a} \int_a^b x , dx = \frac{1}{b - a} \cdot \frac{x^2}{2}\Big|_a^b = \frac{b^2 - a^2}{2(b - a)} = \frac{(b - a)(b + a)}{2(b - a)} = \frac{a + b}{2} \end{aligned}

**美妙的对称性:** 期望值恰好是区间的中点! #### 方差:"宽"到底有多宽? 利用 $\text{Var}(X) = E(X^2) - [E(X)]^2$: **第一步:计算 $E(X^2)$** $$E(X^2) = \int_a^b x^2 \cdot \frac{1}{b - a} \, dx = \frac{1}{b - a} \cdot \frac{x^3}{3}\Big|_a^b = \frac{b^3 - a^3}{3(b - a)} = \frac{a^2 + ab + b^2}{3}$$ **第二步:代入方差公式** $$\text{Var}(X) = \frac{a^2 + ab + b^2}{3} - \left(\frac{a + b}{2}\right)^2 = \frac{(b - a)^2}{12}$$ :::tip[均匀分布:关键性质] 对于 $X \sim \text{Uniform}(a, b)$: $$E(X) = \frac{a + b}{2} \quad \text{(始终是中点)}$$ $$\text{Var}(X) = \frac{(b - a)^2}{12} \quad \text{(仅取决于区间宽度)}$$ **关键洞见:** - 均值 = 中位数 = 中点(完美对称) - 方差仅取决于区间宽度,而非位置 ::: **例 4:参数关系** 连续随机变量 $X$ 在区间 $[a, \beta]$(其中 $\beta > a$)上服从均匀分布。 已知 $E(X) = 8$: 1. 写出一个包含 $a$ 和 $\beta$ 的方程。 同时已知 $P(X \leq 13) = 0.7$: 2. 求 $a$ 和 $\beta$ 的值。 3. 求 $\text{Var}(X)$。 4. 求 $P(5 \leq X \leq 35)$。 **例 5:厨房秤** Albert 用厨房秤称量水果。随机变量 $D$ 表示秤显示的水果重量减去水果真实重量,单位为克。随机变量 $D$ 在区间 $[-2.5, 2.5]$ 上服从均匀分布。 1. 写出 $D$ 的概率密度函数。 2. 求 $D$ 的标准差。 3. Albert 在秤上称一根香蕉。写出秤显示的重量恰好等于香蕉真实重量的概率。 4. 求秤显示的重量在香蕉真实重量 1 克以内的概率。 5. Albert 在秤上逐个称 10 根香蕉。求其中至少有 6 根香蕉的秤重在真实重量 1 克以内的概率。 ## 课后练习 **练习 1:WST02/01/June17/7** 连续随机变量 $X$ 在区间 $[a, b]$ 上服从均匀分布。 1. 用 $a$ 和 $b$ 表示 $E(3 - 2X)$ 的表达式。(2) 2. 求 $P(X > \frac{1}{3}b + \frac{2}{3}a)$。(2) 已知 $E(X) = 0$。 3. 仅用 $b$ 表示 $E(3X^2)$ 的表达式。(3) 同时已知 $X$ 的极差为 $18$。 4. 求 $\text{Var}(X)$。(2) **练习 2:WST02/01/June15/3** 一根意大利面长 $2c$,其中 $c$ 为正常数。它在随机位置被切成两段。连续随机变量 $X$ 表示较长段的长度,在区间 $[c, 2c]$ 上服从均匀分布。 1. 画出 $X$ 的概率密度函数草图。(2) 2. 用积分证明 $\text{Var}(X) = \frac{c^2}{12}$。(6) 3. 求较长段长度超过较短段两倍的概率。(3) **练习 3:6684/01/June15/4** 连续随机变量 $L$ 表示机器切割杆件时的误差(米)。$L$ 的分布是区间 $[0, 0.5]$ 上的连续均匀分布。 1. 求 $P(L < 0.4)$。(1) 2. 写出 $E(L)$。(1) 3. 计算 $\text{Var}(L)$。(2) 从此机器切割的杆件中随机抽取 $30$ 根作为样本。 4. 求误差超过 $0.4$ 米的杆件少于 $4$ 根的概率。(3) 当一台新机器切割杆件时,误差 $X$(米)由累积分布函数 $F(x)$ 建模,其中 $$F(x) = \begin{cases} 0 & x < 0 \\ 4x - 4x^2 & 0 \leq x \leq 0.5 \\ 1 & \text{otherwise} \end{cases}$$ 5. 利用此模型,求 $P(X > 0.4)$。(2) 从此新机器切割的杆件中随机抽取 $100$ 根作为样本。 6. 利用适当的近似方法,求其中至少 $8$ 根杆件的误差超过 $0.4$ 米的概率。(3) ## 2 挑战:蒲丰投针实验 ### 均匀分布理论的终极考验 现在我们将处理概率论中最著名的问题之一——它美妙地展示了均匀分布如何揭示 $\pi$ 本身的奥秘。 1777 年,法国数学家乔治-路易·勒克莱尔(蒲丰伯爵)提出了这个挑战:"随机投掷的针与平行线相交的概率是多少?" :::note[蒲丰投针实验设置] **材料:** - 画有平行线的纸张,线间距为 $1$ - 长度为 $1$ 的针 **实验:** 将针随机投掷到纸面上。 **问题:** $P(\text{针与线相交})$ 是多少? **惊人的发现:** 答案与 $\pi$ 有关! ::: ### 第一步:确定随机变量 :::note[你的任务] **问题:** 我们应该用哪些随机变量来建模这个问题? 思考: - 什么决定了针是否与线相交? - 针的位置中哪些方面是随机的? - 什么分布能自然地建模这些随机方面? ::: **提示 1:** 考虑针相对于线条的位置。 设 $X$ 为针的中心到最近一条线的垂直距离。 **问题 1a:** 线间距为 1 个单位。$X$(针中心到最近线的距离)的可能取值范围是多少? 答案:$X$ 的范围从 \_\_\_\_ 到 \_\_\_\_ **问题 1b:** 如果针是"随机"投掷的,$X$ 应该服从什么分布? **提示:** 由于针是随机投掷的,它落在任何位置的可能性相同。这意味着 $X$ 在其范围内应该服从 \_\_\_\_ 分布。 **问题 1c:** 现在考虑针的方向。设 $\Theta$ 为针与平行线之间的锐角。$\Theta$ 的可能取值范围是多少? 答案:$\Theta$ 的范围从 \_\_\_\_ 到 \_\_\_\_ **问题 1d:** $\Theta$ 应该服从什么分布? **提示:** 由于旋转对称性,针指向任何方向的可能性相同。所以 $\Theta$ 在其范围内应该服从 \_\_\_\_ 分布。 **问题 1e:** $X$ 和 $\Theta$ 是否独立? **想一想:** 针落在哪里会影响它的角度吗?角度会影响它落在哪里吗?你的答案:\_\_\_\_ ### 第二步:确定相交条件 **几何分析:** 针在什么时候与线相交? **问题 2:** 观察示意图。针从中心向每个方向延伸 $\frac{1}{2}$ 个单位。针在什么情况下与最近的线相交?**找出函数 $f(\Theta)$,使得针与线相交当且仅当 $X \leq f(\Theta)$。** ### 第三步:用"平均"法计算概率 由于我们有两个随机方面(位置 $X$ 和角度 $\Theta$),我们需要一种巧妙的方法。让我们一步步来思考: **关键洞见:** 对于每个特定的角度 $\theta$,我们可以很容易地求出针与线相交的概率。然后对所有可能的角度进行"平均"。 **问题 3a:** 假设针的方向为特定角度 $\theta$(其中 $0 \leq \theta \leq \frac{\pi}{2}$)。 - 从第二步可知,针与线相交的条件是 $X \leq$ \_\_\_\_ - 由于 $X$ 在 $[0, \frac{1}{2}]$ 上均匀分布,$P(\text{针与线相交} \mid \text{角度} = \theta)$ 是多少? **让我们通过一个例子来理解:** 如果 $\theta = 30^{\circ} = \frac{\pi}{6}$,则: - 针与线相交的条件是 $X \leq \frac{1}{2}\sin(\frac{\pi}{6}) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4}$ - 由于 $X$ 在 $[0, \frac{1}{2}]$ 上均匀分布:$P(\text{针与线相交} \mid \theta = 30^{\circ}) = \frac{\frac{1}{4}}{\frac{1}{2}} = \frac{1}{2}$ **一般公式:** $P(\text{针与线相交} \mid \text{角度} = \theta) = $ \_\_\_\_ **问题 3b:** 现在我们需要求总概率。由于角度 $\Theta$ 也是随机的且在 $[0, \frac{\pi}{2}]$ 上均匀分布,我们需要对问题 3a 中的条件概率在所有可能角度上进行"平均"。 **数学上的平均:** 当我们有一个连续的取值范围时,"平均"就变成了积分: $$P(\text{针与线相交}) = \frac{1}{\frac{\pi}{2} - 0} \int_0^{\pi/2} P(\text{针与线相交} \mid \text{角度} = \theta) \, d\theta$$ 将问题 3a 的答案代入此公式并计算积分。 **逐步引导:**

\begin{aligned} P(\text{针与线相交}) &= \frac{1}{\frac{\pi}{2}} \int_0^{\pi/2} ___ , d\theta \ &= \frac{2}{\pi} \int_0^{\pi/2} ___ , d\theta \ &= ___ \end{aligned}

### 第四步:发现惊人的结果 **问题 4a:** 完成第三步的计算。你应该得到: $$P(\text{针与线相交}) = \_\_\_$$ **问题 4b:** 看看你的答案!出现了什么著名的数学常数?这就是使蒲丰投针实验如此出名的惊人发现。 **问题 4c:** 重新排列你的概率公式,用相交概率来表示 $\pi$: $$\pi = \_\_\_$$ **问题 4d:** 你如何利用这个实验来估计 $\pi$?如果你做了 1000 次实验并观察到 637 次相交,你对 $\pi$ 的估计值是多少? $$\text{你的计算:} \_\_\_.$$ **拓展挑战:** 1. 如果针的长度不等于线间距会怎样?推导针长为 $\ell$、线间距为 $d$ 时的一般概率公式。 2. 如果 $\ell > d$(针长于线间距),你将如何修改分析? 3. 设计一个使用随手可得的材料(牙签、纸张等)的课堂实验来估计 $\pi$。