知识点:矩阵变量函数的导数
知识点概述
当函数自变量是矩阵时,其导数的定义可以从向量形式推广而来。矩阵导数是一个与自变量维度相同的矩阵,在矩阵优化、机器学习等领域计算梯度时必不可少。
教材原文
对于以 矩阵 为自变量的函数 ,若存在矩阵 满足
…称 为 在 Fréchet 可微意义下的梯度。… 在实际中,由于Gateaux可微定义式更容易操作,因此通常是利用(2.2.6)式进行矩阵变量函数 的求导运算.
详细解释
- 定义: 函数 对矩阵 的导数 是一个与 维度相同的矩阵,它满足 。其中 是矩阵内积(Frobenius内积)。
- 计算方法:
- 写出 的表达式,其中 是一个任意的扰动矩阵, 是一个标量。
- 将其展开为关于 的泰勒级数。
- 找到一次项 中的矩阵 。
- 这个矩阵 就是导数 。
- 维度检查: 一个重要的验算技巧是,导数矩阵 的维度必须与自变量矩阵 的维度完全相同。
学习要点
- 理解矩阵导数的定义是向量导数定义的自然推广。
- 掌握利用方向导数(Gateaux可微)的思想来计算矩阵导数的方法。
- 能够计算常见矩阵函数(如迹函数 、Frobenius范数平方 )的导数。
实践应用
- 矩阵分解: 在推荐系统中,通过梯度下降法求解 时,需要计算损失函数对 和 的矩阵导数。
- 主成分分析(PCA): 求解协方差矩阵特征向量的优化问题时,会涉及矩阵导数。
关联知识点
- 前置知识: 16-核心概念-梯度与海瑟矩阵, 15-核心概念-矩阵范数
- 后续知识: 46-核心概念-矩阵优化, 18-技术实现-自动微分
- 相关知识: 无