S2 第六章：抽样分布

从单个数字到规律：理解统计调查的本质

假设你是一家每天生产 10,000 部手机的工厂的质量控制经理。如何在不检测每一部手机的情况下保证质量？又或者，一项政治民调仅调查了 1,500 名选民就能预测选举结果——这些小样本如何揭示大量总体的真实情况？

本章将探讨使统计推断成为可能的数学基础——抽样分布理论。

1. 抽样的语言

1.1 一个现实中的谜题：手游调查

在正式学习定义之前，让我们通过一个你可能非常熟悉的场景来探索这些概念。

背景设定： 你最喜欢的手机游戏声称传说级 SSR 卡牌的掉率为 1%。但你和同学们怀疑游戏公司在撒谎——实际掉率似乎比宣传的低。

调查过程：

总体： 游戏虚拟卡池中所有可能抽到的卡牌——一个无限集合，其中 1% 应为 SSR 卡牌
参数： 游戏公司声称的真实 SSR 掉率： $p = 0.01$ （1%）
样本： 10 位同学共进行 $n = 200$ 次抽卡
统计量： 200 次抽卡中观察到 $0$ 张 SSR，样本掉率为： $\hat{p} = \frac{0}{200} = 0$

关键问题： 既然 $\hat{p} = 0 < 0.01$ ，这能否证明游戏公司在欺骗玩家？还是说这个差异可能只是随机运气？

统计挑战： 要回答这个问题，我们需要理解 $\hat{p}$ 在不同样本之间如何变化——这正是抽样分布理论的核心！

这个调查完美地说明了为什么我们需要研究抽样分布。现在让我们建立正式的术语体系来系统地分析这类问题。

1.2 构建术语体系——五个基本概念

既然我们已经在实际场景中看到了这些概念，现在来精确地定义它们：

1.3 实际案例：将概念与生活联系起来

1.4 统计量：样本与总体之间的桥梁

现在让我们聚焦于最核心的概念：什么才能称为”统计量”？

让我们通过具体例题来检验你的理解：

假设我们有 5 名学生身高的样本： $X_1 = 160, X_2 = 165, X_3 = 170, X_4 = 155, X_5 = 175$ （单位：厘米）。总体均值 $\mu$ 和方差 $\sigma^2$ 未知。

判断以下哪些是统计量：

$\bar{X} = \frac{160 + 165 + 170 + 155 + 175}{5} = 165$ 厘米 — 答案： _____
$s^2 = \frac{(160-165)^2 + (165-165)^2 + \cdots + (175-165)^2}{5-1} = 62.5$ — 答案： _____
$X_1 - \mu = 160 - \mu$ （其中 $\mu$ 是未知的总体均值）— 答案： _____
$\frac{\bar{X} - \mu}{\sigma/\sqrt{5}}$ （标准化样本均值）— 答案： _____
身高超过 170 厘米的学生人数 = 1 — 答案： _____
$2\bar{X} + 10 = 2(165) + 10 = 340$ — 答案： _____
$\sum_{i=1}^5 (X_i - \mu)^2$ （与总体均值的离差平方和）— 答案： _____

核心洞察： 统计量是我们的”信使”——它们从样本中携带信息，帮助我们了解未知的总体。但它们是不完美的信使，因为它们会随样本的不同而变化！

2. 革命性概念：抽样分布

2.1 回到手游谜题

还记得我们的 SSR 调查吗？200 次抽卡中观察到 $\hat{p} = 0.015$ ，高于声称的 0.01。但在得出游戏公司撒谎的结论之前，我们需要理解： $\hat{p}$ 由于随机抽样应该有多大的波动？

2.2 通过模拟发现抽样分布

背景设定：

我们假设游戏公司说的是真话： $p = 0.01$ （1% 的 SSR 掉率）。

第一步——模拟： 使用随机数生成器（如 random.org）模拟抽 200 张卡，重复 20 次：

生成 200 个介于 $1$ 到 $100$ 之间的随机整数
统计有多少个 $= 1$ （这些代表 SSR 卡牌）
计算你的个人 $\hat{p} = \frac{\text{SSR 数量}}{200}$

第二步——收集数据： 收集全部 20 个 $\hat{p}$ 值。

第三步——创建分布： 统计频率并绘制直方图：

$\hat{p}$ 值	计数	频率
0.00
0.01
0.02
0.03
0.04
0.05
0.06

第四步——得出结论： 根据你创建的分布得出结论。游戏公司公布的掉率有多可疑？

统计学启示： 抽样分布使我们能够量化抽样误差，并判断一个观察到的统计量是罕见事件还是正常波动。

2.3 从直觉到理论

这个实验展示了一个革命性的洞察：我们不再将 $\hat{p}$ （或任何统计量）仅仅看作一个数字，而是将其视为一个具有自身分布的随机变量。

核心洞察： 每次抽取样本，你的统计量都会不同。抽样分布告诉你这些不同值是如何分布的，帮助你区分”正常波动”和”发生了异常情况”。

2.4 数学分析：从模拟到理论

既然我们已经通过模拟体验了抽样分布，现在来看看如何从数学上构建它们。我们将使用一个不同的离散例子来建立理论理解。

游戏情境： 你正在玩一款冒险游戏，宝箱中装有不同价值的硬币。市场调研揭示了宝箱的掉率，你想了解开启多个宝箱时的风险模式。

总体： 大量宝箱，内容如下：

总体分布：

物品	价值（硬币）	概率	稀有度
金币	100	0.1	传说
银币	50	0.3	稀有
铜币	10	0.6	普通

研究问题： 与其研究平均价值（这是可预测的），不如调查更有趣的问题：“开 2 个宝箱时，最有价值物品的分布是什么？”

这个统计量 $M = \max(X_1, X_2)$ 代表了一次小型寻宝中的”最佳运气”！

第一步：列举所有可能结果 对于 2 个宝箱，我们有 $3^2 = 9$ 种可能组合：

样本	$(X_1, X_2)$	概率	最大值 $M$
1	(10, 10)	$0.6 \times 0.6 = 0.36$	10
2	(10, 50)	$0.6 \times 0.3 = 0.18$	50
3	(10, 100)	$0.6 \times 0.1 = 0.06$	100
4	(50, 10)	$0.3 \times 0.6 = 0.18$	50
5	(50, 50)	$0.3 \times 0.3 = 0.09$	50
6	(50, 100)	$0.3 \times 0.1 = 0.03$	100
7	(100, 10)	$0.1 \times 0.6 = 0.06$	100
8	(100, 50)	$0.1 \times 0.3 = 0.03$	100
9	(100, 100)	$0.1 \times 0.1 = 0.01$	100

第二步：构建最大值 $M$ 的抽样分布

最大值 $M$	样本	概率	游戏解读
10	{1}	0.36	”运气真差”
50	{2, 4, 5}	$0.18 + 0.18 + 0.09 = 0.45$	“还不错”
100	{3, 6, 7, 8, 9}	$0.06 + 0.03 + 0.06 + 0.03 + 0.01 = 0.19$	“中大奖！”

统计洞察：

$P(\text{最好物品只是铜币}) = 0.36$ — 超过 1/3 的概率令人失望！
$P(\text{至少找到一枚金币}) = 0.19$ — 远低于单次抽到金币的概率（0.1）
$E(M) = 10 \times 0.36 + 50 \times 0.45 + 100 \times 0.19 = 45.1$ 硬币

游戏策略启示： 尽管金币的单次掉率为 10%，但开 2 个宝箱时最好物品是金币的概率仅为 19%。这说明最大值统计量的行为与均值截然不同！

一款流行的卡牌游戏使用经典的”五抽保底”机制：如果前 4 次抽卡都没有获得传说卡，第 5 次必出传说！

正常抽卡概率：

卡牌类型	概率
传说	0.2
史诗	0.8

保底规则： 如果第 1、2、3、4 次都是史诗，则第 5 次自动为传说。

研究问题： “首次抽到传说卡的位置”统计量 $L$ 的抽样分布是什么？

第一步： 列出关键场景并计算概率：

场景	模式	概率计算	统计量 $L$
1	(传, , , , )	$P(X_1 = L) = 0.2$	$L =$
2	(史, 传, , , *)	$P(X_1 = E) \times P(X_2 = L) =$ ___	$L =$
3	(史, 史, 传, , )	___	$L =$
4	(史, 史, 史, 传, *)	___	$L =$
5	(史, 史, 史, 史, 传)	___	$L =$

第二步： 构建 $L$ 的抽样分布：

$L$ 值	概率	游戏体验
1	0.2	”一发入魂！“
2	___	“运气不错”
3	___	“事不过三”
4	___	“差点触发保底”
5	___	“保底拯救了你”

第三步： 回答以下策略问题：

需要保底系统的概率是多少？
首次抽到传说卡的期望位置是多少？
与没有保底系统的 5 次独立抽卡相比如何？

现实情境： 喜茶正在考虑在我们学校附近开一家新店。他们聘请你们作为学生顾问进行市场调研！

问题： “如果在这里开店，有多少百分比的学生会每周至少买一次奶茶？”

任务： 设计并分析一项抽样研究，帮助喜茶做出这个重要的商业决策。

第一步：定义研究框架

总体： ____________
关注的参数： 设 $p$ = 真实的学生中每周购买奶茶的比例。喜茶需要 $p \geq 0.40$ （40%）才能使门店盈利。
抽样框： ____________
样本量： 你的团队决定调查 $n = 50$ 名随机选取的学生。

第二步：商业启示

如果你们班发现 $\hat{p}_{class} = 0.36$ （36%），喜茶是否应立即认为该市场不可行？
抽样变异性对于基于有限数据做商业决策有什么启示？

统计挑战： 如果真实的总体比例实际上是 $p = 0.4$ （高于盈利门槛），那么 50 名学生的样本给出 $\hat{p} \leq 0.36$ 的概率是多少？这可能会导致喜茶做出错误的商业决策。

3. 解开手游之谜

现在我们可以用正确的理论框架回到最初的问题了！

3.1 深入分析：使用正确的分布

现在让我们用最合适的统计模型来分析这个问题。由于我们处理的是稀有事件（低概率、大样本），泊松分布非常适合！

更聪明的方法： 与其分析比例，不如直接研究 SSR 卡牌的计数！

我们的统计量： $X =$ 200 次抽卡中的 SSR 数量

数学基础： 如果公司的声明是真的（ $p = 0.01$ ），则：

$X \sim \text{Binomial}(n = 200, p = 0.01) \approx \text{Poisson}(\lambda = np = 200 \times 0.01 = 2)$

这很直观：我们期望 200 次抽卡中平均约有 2 张 SSR。

这个分布的样子：

$X$ （SSR 数量）	$P(X = x)$	解读
0	$e^{-2} \cdot \frac{2^0}{0!} = 0.135$	”运气太差了”
1	$e^{-2} \cdot \frac{2^1}{1!} = 0.271$	”低于平均水平”
2	$e^{-2} \cdot \frac{2^2}{2!} = 0.271$	”刚好符合预期”
3	$e^{-2} \cdot \frac{2^3}{3!} = 0.180$	”我们的观察值！“
4	$e^{-2} \cdot \frac{2^4}{4!} = 0.090$	”连续走运”
5+	$\approx 0.053$	“运气爆棚”

关键问题： 如果公司是诚实的，观察到 0 张 SSR 有多不寻常？

计算证据：

$P(X = 0) = 0.135$

解读： 即使真实掉率为 1%，仍有约 13.5% 的概率抽到 0 张 SSR。这并不罕见！

“更极端”的证据： 如果我们想在两个方向上检验呢（公司可能在掉率上说高了或说低了）？

$P(|X - 2| \geq 2) = P(X = 0 \text{ 或 } X \geq 4) = 0.135 + 0.090 = 0.225$

约 22.5% 的样本会偏离期望值 2 这么多！

结论： 我们观察到 0 张 SSR 为反驳公司的声明提供了较弱的证据。这完全在随机波动的范围内。

4. 预告：假设检验的世界

我们刚才所做的正是统计假设检验的基础——这是我们下一章的主题！

我们遵循的步骤：

零假设： 假设公司是诚实的：“真实 SSR 掉率 = 1%”
选择合适的统计量： SSR 卡牌计数： $X = 0$ （对稀有事件比比例更合适）
找到抽样分布： 在零假设下， $X \sim \text{Poisson}(2)$
计算 p 值： $P(X \geq 0) = 0.135$ （我们的证据或更强证据的概率）
做出决策： 13.5% 相当高 → 没有足够证据拒绝公司的声明

为什么这种方法强大：

客观： 我们使用精确的概率计算而非主观判断
校准： 我们精确量化了观察值有多不寻常
公平： 我们给予公司”疑点利益”（先假定清白）
系统化： 同样的流程适用于任何关于总体参数的声明

下一章预告——正式的假设检验：

如何系统地设立零假设和备择假设
决策规则：证据何时”足够强”以拒绝一个声明？
单尾检验与双尾检验：有方向性与无方向性的声明

革命性意义： 我们已经从”这看起来可疑……”进步到”这有 13.5% 的概率是巧合”。这种精确性改变了商业决策、科学结论和公共政策！

统计智慧： 你已经体验了从”直觉判断”→“精确概率”→“理性决策”的进化。这就是科学思维的本质！

作业练习

一家乳品厂生产的盒装牛奶的容量 $M$ （升）服从分布 $N(\mu, \sigma^2)$ ，其中 $\mu$ 和 $\sigma$ 未知。随机抽取 12 盒牛奶，测量每盒的容量（ $M_1$ , $M_2$ , …, $M_{12}$ ）。统计量 X 基于此样本。

解释本题中”随机样本”的含义。\hfill (1)
说明本题中的总体。\hfill (1)
写出 $\displaystyle \frac{M_{12} - \mu}{\sigma}$ 的分布。\hfill (1)
解释你对 X 的抽样分布的理解。\hfill (1)
说明以下哪一项不是基于此样本的统计量，并给出理由。
1. $\displaystyle 3M_1 + \frac{2M_{11}}{6}$
2. $\displaystyle \sum_{i=1}^{12} \left( \frac{M_i - \mu}{\sigma} \right)^2$
3. $\displaystyle \sum_{i=1}^{12}(2M_i - 3)$
\hfill (2)