S2 第四章：连续型随机变量

两种不同的随机性

想象你在一个客服呼叫中心工作。在前面几章中，我们已经掌握了描述”计数”的艺术——二项分布和泊松分布告诉我们事件发生了多少次。但现在，我们要问一个根本不同的问题：我们需要等多久，才能等到第一次事件发生？

连续型随机变量的语言

概率密度函数（PDF）——连续的”概率质量”

连续型随机变量的根本挑战在于：可能取值有无穷多个，因此任何精确取值的概率都为零。取而代之，我们用概率密度来思考。

可视化过渡：从离散到连续

通过观察可能取值不断增加时发生的情况来理解这一概念：

离散：少量取值 — 概率较高（每根柱子都很高）

离散：更多取值 — 概率较低（柱子缩小，更多取值共享总概率）

连续：无穷多个取值 — 曲线下面积等于概率

$P(a < X < b) = f(x) \text{ 在 } a \text{ 与 } b \text{ 之间的曲线下面积}$

这一可视化展示了为什么我们需要一套新的数学框架来处理连续型随机变量。曲线上任意一点的”高度”代表概率密度，两点之间的曲线下面积给出实际概率。

定义（概率密度函数）：

对于连续型随机变量 $X$ ，我们用一个函数 $f(x)$ 来描述其概率分布，称为概率密度函数（PDF）。它满足：

$f(x) \geq 0$ 对所有 $x$ 成立（概率密度非负）
$P(a < X < b) = \int_a^b f(x) \, dx$ （概率是曲线下面积）
$\int_{-\infty}^{\infty} f(x) \, dx = 1$ （总面积代表总概率 = 1）

例题：

考虑一个随机变量 $X$ ，其概率密度函数为：

\frac{2x}{9} & \text{if } 0 \leq x \leq 3 \\ 0 & \text{otherwise} \end{cases}$$ --- **（a）部分：验证这是一个有效的PDF** 我们需要检验两个基本条件： *条件 (i)：* $f(x) \geq 0$ 对所有 $x$ 成立 - 对于 $0 \leq x \leq 3$：$f(x) = \frac{2x}{9} \geq 0$，因为 $x \geq 0$ ✓ - 对于 $x < 0$ 或 $x > 3$：$f(x) = 0 \geq 0$ ✓ *条件 (ii)：* $\int_{-\infty}^{\infty} f(x) \, dx = 1$ $$\int_{-\infty}^{\infty} f(x) \, dx = \int_0^3 \frac{2x}{9} \, dx = \frac{2}{9} \cdot \frac{x^2}{2}\Big|_0^3 = \frac{1}{9} \cdot 9 = 1$$ **（b）部分：求 $P(1 < X < 2)$** $$P(1 < X < 2) = \int_1^2 \frac{2x}{9} \, dx = \frac{2}{9} \cdot \frac{x^2}{2}\Big|_1^2 = \frac{1}{9}(4-1) = \boxed{\frac{1}{3}}$$ --- ### 累积分布函数（CDF）——从起点到现在 **定义（累积分布函数）：** 累积分布函数定义为： $$F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) \, dt$$ 它表示随机变量取值小于或等于 $x$ 的概率。 :::tip[CDF 的关键性质] 对于任意连续型随机变量的 CDF $F(x)$： **1. 单调不减：** 若 $x_1 < x_2$，则 $F(x_1) \leq F(x_2)$ - *直觉：* 在数轴上向右移动时，我们只能累积更多概率，不会减少 **2. 连续性：** 对于分段定义的CDF，各段交界处的取值是一致的。 **3. 值域：** 对所有 $x$，$0 \leq F(x) \leq 1$ - *解释：* CDF 代表累积概率，必须介于 0 和 1 之间 **4. 概率计算：** $P(a < X < b) = P(a \leq X \leq b) = P(a < X \leq b) = F(b) - F(a)$ ::: **定理（PDF 与 CDF 的基本关系）：** 对于连续型随机变量： $$f(x) = \frac{d}{dx} F(x)$$ 这意味着： - CDF 是 PDF 的积分 - PDF 是 CDF 的导数 这正是微积分基本定理在概率论中的完美体现！ **例题（从 CDF 到 PDF）：** 连续型随机变量 $X$ 的累积分布函数为： $$F(x) = \begin{cases} 0 & x < 0 \\ \frac{x^3}{8} & 0 \leq x \leq 2 \\ 1 & x > 2 \end{cases}$$ --- **（a）部分：求 PDF $f(x)$** 利用基本关系 $f(x) = \frac{d}{dx} F(x)$，对每段求导： - 对于 $x < 0$：$f(x) = \frac{d}{dx}(0) = 0$ - 对于 $0 \leq x \leq 2$：$f(x) = \frac{d}{dx}\left(\frac{x^3}{8}\right) = \frac{3x^2}{8}$ - 对于 $x > 2$：$f(x) = \frac{d}{dx}(1) = 0$ 因此： $$\boxed{f(x) = \begin{cases} \frac{3x^2}{8} & 0 \leq x \leq 2 \\ 0 & \text{otherwise} \end{cases}}$$ **（b）部分：验证这是一个有效的PDF** 检验 $\int_{-\infty}^{\infty} f(x) \, dx = 1$： $$\int_{-\infty}^{\infty} f(x) \, dx = \int_0^2 \frac{3x^2}{8} \, dx = \frac{3}{8} \cdot \frac{x^3}{3}\Big|_0^2 = \frac{1}{8} \cdot 8 = 1$$ **（c）部分：求 $P(0.5 < X < 1.5)$** 用 CDF 方法：$P(0.5 < X < 1.5) = F(1.5) - F(0.5)$

\begin{aligned} P(0.5 < X < 1.5) &= F(1.5) - F(0.5) \ &= \frac{(1.5)^3}{8} - \frac{(0.5)^3}{8} \ &= \frac{3.375 - 0.125}{8} \ &= \frac{3.25}{8} = \boxed{0.40625} \end{aligned}

--- **例题（课堂练习）：** 连续型随机变量 $Y$ 的累积分布函数为： $$F(y) = \begin{cases} 0 & y < 1 \\ a(y-1)^2 & 1 \leq y \leq 3 \\ 1 & y > 3 \end{cases}$$ 其中 $a$ 是一个正常数。 1. 求 $a$ 的值 2. 确定概率密度函数 $f(y)$ 3. 分别用 CDF 和 PDF 两种方法计算 $P(Y > 2)$ **你的解答：** ### 数字特征——均值、方差与变换 #### 从离散求和到连续积分：自然的演化 在学习离散型随机变量时，我们用加权求和来计算期望值： $$E(X) = \sum_{i} x_i \cdot P(X = x_i)$$ 但当我们过渡到连续型变量时，对于任何特定值 $P(X = x_i) = 0$，该怎么办？答案在于一个美妙的数学演化：**求和变成积分**。 :::tip[直觉桥梁：从求和到积分] **离散情形：** $E(X) = \sum_i x_i \cdot P(X = x_i)$ - 每个值 $x_i$ 按其概率 $P(X = x_i)$ 加权 - 对所有可能的离散值求和 **连续情形：** $E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx$ - 每个值 $x$ 按其概率密度 $f(x)$ 加权 - 对所有可能的连续值积分 - 积分代表"越来越精细的求和的极限" **物理解释：** 把 $f(x)$ 想象成一根杆的"质量密度"。期望值就是质心——杆在支点上完美平衡的点。 ::: **定义（连续型随机变量的期望与方差）：** 对于连续型随机变量 $X$，其 PDF 为 $f(x)$： **期望值（均值）：** $$E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx$$ 这代表分布的"重心"或平均值。 **方差：** $$\text{Var}(X) = E[(X-\mu)^2] = \int_{-\infty}^{\infty} (x-\mu)^2 f(x) \, dx = E(X^2) - [E(X)]^2$$ 这衡量围绕均值的"散布"或离散程度。 **函数的期望值：** $$E[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) \, dx$$ 这个强大的公式允许我们求 $X$ 的任何变换的期望值。 **定理（线性变换）：** 对于连续型随机变量 $X$ 和常数 $a$、$b$： - $E(aX + b) = aE(X) + b$ - $\text{Var}(aX + b) = a^2 \text{Var}(X)$ **例题（Beta 型分布）：** 考虑连续型随机变量 $X$，其 PDF 为： $$f(x) = \begin{cases} 6x(1-x) & 0 \leq x \leq 1 \\ 0 & \text{otherwise} \end{cases}$$ --- **完整解答：** **（a）部分：验证这是一个有效的 PDF** 检验 $\int_{-\infty}^{\infty} f(x) \, dx = 1$：

\begin{aligned} \int_0^1 6x(1-x) , dx &= 6\int_0^1 (x - x^2) , dx \ &= 6\left[\frac{x^2}{2} - \frac{x^3}{3}\right]_0^1 \ &= 6\left(\frac{1}{2} - \frac{1}{3}\right) = 6 \cdot \frac{1}{6} = 1 \end{aligned}

**（b）部分：计算 $E(X)$** $$E(X) = \int_0^1 x \cdot 6x(1-x) \, dx = 6\int_0^1 (x^2 - x^3) \, dx$$ $$= 6\left[\frac{x^3}{3} - \frac{x^4}{4}\right]_0^1 = 6\left(\frac{1}{3} - \frac{1}{4}\right) = \boxed{\frac{1}{2}}$$ **（c）部分：计算 $\text{Var}(X)$** *第一步：求 $E(X^2)$* $$E(X^2) = \int_0^1 x^2 \cdot 6x(1-x) \, dx = 6\int_0^1 (x^3 - x^4) \, dx$$ $$= 6\left[\frac{x^4}{4} - \frac{x^5}{5}\right]_0^1 = 6\left(\frac{1}{4} - \frac{1}{5}\right) = \frac{3}{10}$$ *第二步：代入方差公式* $$\text{Var}(X) = E(X^2) - [E(X)]^2 = \frac{3}{10} - \left(\frac{1}{2}\right)^2 = \frac{3}{10} - \frac{1}{4} = \boxed{\frac{1}{20}}$$ --- ### 百分位数与众数——分布的地标 #### 百分位数：划分概率质量 **定义（百分位数与分位数）：** 连续分布的第 $p$ 百分位数（或分位数）是满足以下条件的值 $q_p$： $$P(X \leq q_p) = F(q_p) = \frac{p}{100}$$ **解释：** $p\%$ 的概率质量在 $q_p$ 左侧，$(100-p)\%$ 在右侧。 **特殊情况：** - **中位数**（$q_{50}$）：$F(q_{50}) = 0.5$ 的"中间"值 - **第一四分位数**（$q_{25}$）：25% 的值低于此点 - **第三四分位数**（$q_{75}$）：75% 的值低于此点 #### 众数：概率密度的峰值 **定义（众数）：** 连续分布的众数是使 PDF $f(x)$ 取最大值的 $x$ 值。可以通过求解以下条件找到： $$\frac{d}{dx} f(x) = 0, \quad \frac{d^2}{dx^2} f(x) < 0$$ 且 众数代表分布中最"密集"的点——概率最集中的地方。 ### 评估分布形状：理解偏态 #### 检测偏态的视觉方法 **例题（视觉偏态检测练习）：** 观察这三个分布，大致标出众数、中位数和均值，判断其偏态： :::tip[均值-中位数-众数的关系] 这是判断偏态最实用的方法： | 分布类型 | 关系 | 解释 | |---|---|---| | 对称 | 均值 $=$ 中位数 $=$ 众数 | 无偏态 | | 右偏 | 均值 $>$ 中位数 $>$ 众数 | 正偏 | | 左偏 | 均值 $<$ 中位数 $<$ 众数 | 负偏 | **为什么成立：** 均值被"拉向"尾部，因为它对极端值敏感，而中位数和众数对异常值更具抵抗力。 ::: **分布 A：** 右偏（长右尾） **分布 B：** 对称（钟形） **分布 C：** 左偏（长左尾） **例题（课堂练习）：** 连续型随机变量 $Z$ 的概率密度函数为： $$f(z) = \begin{cases} ce^{-2z} & z \geq 0 \\ 0 & z < 0 \end{cases}$$ 其中 $c$ 是一个正常数。 1. 求 $c$ 的值 2. 计算 $E(Z)$ 和 $\text{Var}(Z)$ 3. 求 $P(Z > E(Z))$ 并评论此结果 4. 利用变换性质求 $E(3Z + 2)$ 和 $\text{Var}(3Z + 2)$ 5. 计算 $P(Z > 1 | Z > 0.5)$ 并解释结果 6. 计算 $Z$ 的中位数和四分位距 7. 画出 $f(z)$ 的草图，在图上标出此分布的众数、中位数和均值，讨论此分布的偏态 **你的解答：** ## 作业练习 :::note[Jan15/2] 连续型随机变量 $X$ 的累积分布函数为 $$F(x) = \begin{cases} 0 & x < 1 \\ \frac{1}{5}(x-1) & 1 \leq x \leq 6 \\ 1 & x > 6 \end{cases}$$ 1. 求 P($X > 4$) 2. 写出 P($X \neq 4$) 的值 3. 求 $X$ 的概率密度函数，明确写出所有 $x$ 的取值 4. 写出 E($X$) 的值 5. 求 Var($X$) 6. 由此或用其他方法求 E($3X^2 + 1$) ::: :::note[Jan15/5] 随机变量 $X$ 的概率密度函数 $f(x)$ 为 $$f(x) = \begin{cases} k(x^2 + a) & -1 < x \leq 2 \\ 3k & 2 < x \leq 3 \\ 0 & \text{otherwise} \end{cases}$$ 其中 $k$ 和 $a$ 是常数。 已知 E($X$) = $\frac{17}{12}$ 1. 求 $k$ 和 $a$ 的值 2. 写出 $X$ 的众数 ::: :::note[June14/2] 随机变量 $X$ 的累积分布函数 F($x$) 为 $$F(x) = \begin{cases} 0 & x < 0 \\ \frac{x^2}{20}(9-2x) & 0 \leq x \leq 2 \\ 1 & x > 2 \end{cases}$$ 1. 验证 $X$ 的中位数在 1.23 和 1.24 之间 2. 完整写出概率密度函数 $f(x)$ 3. 求 $X$ 的众数 4. 描述此分布的偏态。说明理由。 ::: ## （选修）从泊松分布到指数分布 :::tip[背景回顾与铺垫] **回顾泊松过程的三个条件：** 1. 事件**独立**发生 2. 事件**单独**发生（不同时发生多个） 3. 事件以**恒定平均速率** $\lambda$ 发生 **回顾：泊松分布 PMF** 当满足这些条件时，固定时间区间内发生的事件数 $X$ 服从泊松分布： $$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, 3, \ldots$$ 其中： 其中： - $\lambda$ 是每个时间区间内事件的平均发生次数 - $k$ 是实际观测到的事件数 ::: **核心洞察：** 我们知道如何计数事件，但事件之间的等待时间呢？ **场景：** 假设一个过程（如客服呼叫中心的来电）是速率为 $\lambda$ 的泊松过程。 **定义：** 设 $T$ 为表示**到第一次事件发生的等待时间**的随机变量。 **挑战任务：求随机变量 $T$ 的概率分布** #### 推导目标 1. 求累积分布函数 $F_T(t) = P(T \leq t)$ 2. 对 $F_T(t)$ 求导得到概率密度函数 $f_T(t)$ 3. 计算 $T$ 的期望值 --- **第一步：求累积分布函数** **设定：** 设 $N(t)$ 为时间区间 $[0, t]$ 内发生的事件数。 已知：$N(t) \sim \text{Po}(\lambda t)$ **关键问题：** $F_T(t) = P(T \leq t)$ 代表什么？ **回答：** "在时间 $t$ 内第一次事件发生的概率" **策略洞察：** 用补集方法！ "在时间 $t$ 内第一次事件发生" $\Leftrightarrow$ "在时间 $t$ 内至少发生一次事件" 因此：$P(T \leq t) = 1 - P(\text{在时间 } t \text{ 内没有事件发生}) = 1 - P(N(t) = 0)$ **轮到你了：** 用泊松 PMF 计算 $P(N(t) = 0)$ 并求出 $F_T(t)$。 对 $t \geq 0$， $$F_T(t) = P(T \leq t) = 1 - P(N(t) = 0) = \_\_\_$$ **第二步：求概率密度函数** **回顾：** 对于连续型随机变量，$f_T(t) = \frac{d}{dt} F_T(t)$ **轮到你了：** 对第一步中求得的 CDF 求导得到 PDF。 $$f_T(t) = \frac{d}{dt} F_T(t) = \_\_\_ \quad t \geq 0$$ **第三步：计算期望值** **轮到你了：** 用第二步中求得的 PDF 计算 $E(T)$。 $$E(T) = \int_0^{\infty} t \cdot f_T(t) \, dt = \_\_\_$$ **提示：** 使用分部积分法。 --- :::tip[指数分布] 我们成功推导出：在泊松过程中，等待时间 $T$ 服从参数为 $\lambda$ 的**指数分布**，记作 $T \sim \text{Exp}(\lambda)$。 **关键性质：** - PDF：$f(t) = \lambda e^{-\lambda t}$，$t \geq 0$ - CDF：$F(t) = 1 - e^{-\lambda t}$，$t \geq 0$ - 均值：$E(T) = \frac{1}{\lambda}$ **解释：** 如果事件以速率 $\lambda$ 每单位时间发生，则到第一次事件的平均等待时间为 $\frac{1}{\lambda}$ 个时间单位。 ::: :::note[指数分布的应用] 1. 如果客户以每小时 3 人的速率到达银行，下一个客户在 15 分钟内到达的概率是多少？ 2. 如果一个灯泡的平均寿命为 1000 小时，它能使用超过 1200 小时的概率是多少？（假设服从指数分布） **你的解答：** :::