知识点概述
正态随机向量的线性变换是多元正态分布最核心、最根本的性质。它指出,对一个服从多元正态分布的随机向量进行任意的线性变换(矩阵乘法加向量平移),得到的新随机向量仍然服从多元正态分布。这个性质保证了正态分布家族在线性运算下的封闭性,是其在理论和应用中占据核心地位的根本原因。
教材原文
(教材在第三章介绍多元正态的线性变换以后,增加了证明正态总体样本均值与样本方差的独立性一节。这表明线性变换是其核心性质之一。)
详细解释
1. 定理内容
设 是一个n维正态随机向量,其分布为:
定义一个新的m维随机向量 ,它是 的线性变换:
其中:
- 是一个 的常数矩阵。
- 是一个 的常数向量。
那么, 也服从多元正态分布,其均值向量和协方差矩阵为:
- 新的均值向量:
- 新的协方差矩阵:
即:
2. 参数变换的推导
-
均值向量的推导: 利用期望的线性性质。 。
-
协方差矩阵的推导: 利用协方差矩阵的性质。 (平移不影响协方差)。 根据协方差矩阵的线性变换性质,可得 。
3. 重要特例与应用
-
任意线性组合是一维正态分布: 这是多元正态分布的等价定义。如果我们取 ,那么 就是一个 的行向量,记为 , 是一个标量0。那么 就是一个一维随机变量。根据定理, 服从一维正态分布,其均值为 ,方差为 。
-
边缘分布是正态分布: 如果我们想求子向量(例如前k个分量)的分布,可以构造一个选择矩阵 (例如,前k行为单位矩阵的对应块,其余为0),通过线性变换 提取出子向量。根据定理,这个子向量仍然服从多元正态分布。
-
正交变换与独立性: 在主成分分析(PCA)中,我们寻找一个特殊的正交矩阵 ,对中心化的随机向量 进行线性变换 。这个变换的目标是使得新的协方差矩阵 成为一个对角矩阵。由于新的协方差矩阵非对角元全为0,这意味着新的随机向量 的所有分量都是相互独立的。这实现了从相关的多维数据中提取出不相关的(对于正态分布即独立的)主成分。
学习要点
- 记住公式: 必须牢记线性变换后新的均值向量和协方差矩阵的计算公式: 和 。注意协方差矩阵变换中 和其转置 的位置。
- 理解本质: 理解这个性质是正态分布“家族”保持其特征(正态性)的关键。无论如何对正态向量进行“拉伸”、“旋转”、“平移”(即线性变换),它仍然是正态家族的一员。
- 应用广泛: 认识到这个性质是许多高级统计方法(如因子分析、主成分分析、卡尔曼滤波)的理论基础。
关联知识点
- 前置知识:
- 核心应用:
- 079-应用案例-样本均值与样本方差的独立性
- 主成分分析 (PCA)