知识点概述

正态随机向量的线性变换是多元正态分布最核心、最根本的性质。它指出,对一个服从多元正态分布的随机向量进行任意的线性变换(矩阵乘法加向量平移),得到的新随机向量仍然服从多元正态分布。这个性质保证了正态分布家族在线性运算下的封闭性,是其在理论和应用中占据核心地位的根本原因。

教材原文

(教材在第三章介绍多元正态的线性变换以后,增加了证明正态总体样本均值与样本方差的独立性一节。这表明线性变换是其核心性质之一。)

详细解释

1. 定理内容

是一个n维正态随机向量,其分布为:

定义一个新的m维随机向量 ,它是 的线性变换:

其中:

  • 是一个 的常数矩阵。
  • 是一个 的常数向量。

那么, 也服从多元正态分布,其均值向量和协方差矩阵为:

  • 新的均值向量:
  • 新的协方差矩阵:

即:

2. 参数变换的推导

  • 均值向量的推导: 利用期望的线性性质。

  • 协方差矩阵的推导: 利用协方差矩阵的性质。 (平移不影响协方差)。 根据协方差矩阵的线性变换性质,可得

3. 重要特例与应用

  • 任意线性组合是一维正态分布: 这是多元正态分布的等价定义。如果我们取 ,那么 就是一个 的行向量,记为 是一个标量0。那么 就是一个一维随机变量。根据定理, 服从一维正态分布,其均值为 ,方差为

  • 边缘分布是正态分布: 如果我们想求子向量(例如前k个分量)的分布,可以构造一个选择矩阵 (例如,前k行为单位矩阵的对应块,其余为0),通过线性变换 提取出子向量。根据定理,这个子向量仍然服从多元正态分布。

  • 正交变换与独立性: 在主成分分析(PCA)中,我们寻找一个特殊的正交矩阵 ,对中心化的随机向量 进行线性变换 。这个变换的目标是使得新的协方差矩阵 成为一个对角矩阵。由于新的协方差矩阵非对角元全为0,这意味着新的随机向量 的所有分量都是相互独立的。这实现了从相关的多维数据中提取出不相关的(对于正态分布即独立的)主成分。

学习要点

  • 记住公式: 必须牢记线性变换后新的均值向量和协方差矩阵的计算公式:。注意协方差矩阵变换中 和其转置 的位置。
  • 理解本质: 理解这个性质是正态分布“家族”保持其特征(正态性)的关键。无论如何对正态向量进行“拉伸”、“旋转”、“平移”(即线性变换),它仍然是正态家族的一员。
  • 应用广泛: 认识到这个性质是许多高级统计方法(如因子分析、主成分分析、卡尔曼滤波)的理论基础。

关联知识点