知识点:矩阵变量函数的导数

知识点概述

当函数自变量是矩阵时,其导数的定义可以从向量形式推广而来。矩阵导数是一个与自变量维度相同的矩阵,在矩阵优化、机器学习等领域计算梯度时必不可少。

教材原文

对于以 矩阵 为自变量的函数 ,若存在矩阵 满足

…称 在 Fréchet 可微意义下的梯度。… 在实际中,由于Gateaux可微定义式更容易操作,因此通常是利用(2.2.6)式进行矩阵变量函数 的求导运算.

详细解释

  • 定义: 函数 对矩阵 的导数 是一个与 维度相同的矩阵,它满足 。其中 是矩阵内积(Frobenius内积)。
  • 计算方法:
    1. 写出 的表达式,其中 是一个任意的扰动矩阵, 是一个标量。
    2. 将其展开为关于 的泰勒级数。
    3. 找到一次项 中的矩阵
    4. 这个矩阵 就是导数
  • 维度检查: 一个重要的验算技巧是,导数矩阵 的维度必须与自变量矩阵 的维度完全相同。

学习要点

  • 理解矩阵导数的定义是向量导数定义的自然推广。
  • 掌握利用方向导数(Gateaux可微)的思想来计算矩阵导数的方法。
  • 能够计算常见矩阵函数(如迹函数 、Frobenius范数平方 )的导数。

实践应用

  • 矩阵分解: 在推荐系统中,通过梯度下降法求解 时,需要计算损失函数对 的矩阵导数。
  • 主成分分析(PCA): 求解协方差矩阵特征向量的优化问题时,会涉及矩阵导数。

关联知识点