知识点:次梯度
知识点概述
次梯度是梯度概念在不可微凸函数上的推广。一个凸函数在某点可能没有唯一的梯度,但它一定存在至少一个次梯度,所有次梯度的集合构成了次微分。
教材原文
定义2.24 (次梯度) 对于凸函数 ,向量 称为 在点 处的次梯度,如果
f (z) \geqslant f (x) + g ^ {\mathrm {T}} (z - x), \quad \forall z \in \mathbf {d o m} f.
函数 $f$ 在点 $x$ 处的所有次梯度的集合称为 $f$ 在 $x$ 处的次微分,记作 $\partial f(x)$ 。
详细解释
- 定义: 向量 是 在 点的次梯度,如果由点 和梯度 定义的仿射函数是 的一个全局下支撑。
- 次微分: 在点 的所有次梯度的集合 称为次微分。次微分是一个非空的闭凸集。
- 与梯度的关系:
- 如果函数 在点 处可微,那么其次微分集合中只包含一个元素,就是该点的梯度 。
- 如果函数在某点不可微(例如绝对值函数 在 处),其次微分可能包含多个向量(例如 在 的次微分是区间 )。
学习要点
- 掌握次梯度的定义(全局下支撑)。
- 理解次微分是所有次梯度的集合。
- 知道可微点的次微分就是梯度。
- 能够计算一些简单函数(如 , )的次微分。
实践应用
- 最优性条件: 对于无约束凸优化问题, 是最优解的充要条件是 。这是梯度为零条件向非光滑函数的推广。
- 次梯度算法: 一种简单的非光滑凸优化算法,它在每一步迭代时使用一个任意的次梯度来代替梯度进行更新。
关联知识点
- 前置知识: 24-核心概念-凸函数, 16-核心概念-梯度与海瑟矩阵
- 后续知识: 52-理论方法-无约束不可微问题最优性条件, 59-理论方法-次梯度算法
- 相关知识: 无