知识点概述
在统计学中,一个极其重要而又不直观的结论是:对于从正态总体中抽取的独立同分布(i.i.d.)样本,其样本均值 和样本方差 是相互独立的随机变量。这个定理通常被称为费雪定理(Fisher’s Theorem),它是构建t分布和F分布等重要抽样分布的理论基石。
教材原文
(教材在第三章介绍多元正态的线性变换以后,增加了证明正态总体样本均值与样本方差的独立性一节。)
详细解释
1. 定义
- 样本: 设 是从一个正态总体 中抽取的独立同分布(i.i.d.)的样本。
- 样本均值:
- 样本方差:
2. 定理内容 (Fisher’s Theorem)
在上述定义下,有以下三个重要结论:
- 样本均值 服从正态分布: 。
- 服从自由度为 的卡方分布: 。
- 和 是相互独立的随机变量。
3. 独立性的证明思路
要严格证明 和 的独立性,通常需要用到正态随机向量的线性变换的性质,尤其是正交变换。
- 构造正交变换: 构造一个 的正交矩阵 ,其第一行所有元素都是 。 1/\sqrt{n} & 1/\sqrt{n} & \cdots & 1/\sqrt{n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix}$$
- 进行线性变换: 定义一个新的随机向量 ,其中 。由于 是一个多元正态向量(因为各分量独立且服从正态分布),根据正态向量线性变换的性质, 也服从多元正态分布。
- 计算新向量的参数:
- 可以证明,新向量 的协方差矩阵是一个对角矩阵,这意味着 的所有分量 是相互独立的。
- 建立新旧变量的关系:
- 可以算出,新向量的第一个分量 。因此, 只与样本均值 有关。
- 利用正交变换的性质(保持范数不变),可以证明 。因此,样本方差 只与 有关。
- 得出结论:
- 由于 与 相互独立,而 是 的函数, 是 的函数。
- 因此, 和 相互独立。
学习要点
- 前提是正态总体: 这个定理的成立,强依赖于原始总体是正态分布的假设。对于非正态总体,样本均值和样本方差通常不独立。
- 直观理解的困难: 均值和方差的计算都用到了同一组样本数据 ,因此直观上会认为它们是相关的。这个定理的结论是反直觉的,但又是正确的,体现了正态分布优美的数学性质。
- 理论意义: 这个定理是数理统计中构造t统计量和F统计量的关键。例如,t统计量的定义 ,其分子是标准正态变量,分母是卡方分布变量的函数,而分子分母的独立性是t分布能够成立的保证。
关联知识点
- 前置知识:
- 078-理论方法-正态随机向量的线性变换
- 卡方分布 (Chi-squared Distribution)
- 后续知识:
- t分布 (Student’s t-distribution)
- F分布 (F-distribution)
- 假设检验与置信区间