知识点:次梯度

知识点概述

次梯度是梯度概念在不可微凸函数上的推广。一个凸函数在某点可能没有唯一的梯度,但它一定存在至少一个次梯度,所有次梯度的集合构成了次微分。

教材原文

定义2.24 (次梯度) 对于凸函数 ,向量 称为 在点 处的次梯度,如果

f (z) \geqslant f (x) + g ^ {\mathrm {T}} (z - x), \quad \forall z \in \mathbf {d o m} f.

函数 $f$ 在点 $x$ 处的所有次梯度的集合称为 $f$ 在 $x$ 处的次微分,记作 $\partial f(x)$ 。

详细解释

  • 定义: 向量 点的次梯度,如果由点 和梯度 定义的仿射函数是 的一个全局下支撑。
  • 次微分: 在点 的所有次梯度的集合 称为次微分。次微分是一个非空的闭凸集。
  • 与梯度的关系:
    • 如果函数 在点 处可微,那么其次微分集合中只包含一个元素,就是该点的梯度
    • 如果函数在某点不可微(例如绝对值函数 处),其次微分可能包含多个向量(例如 的次微分是区间 )。

学习要点

  • 掌握次梯度的定义(全局下支撑)。
  • 理解次微分是所有次梯度的集合。
  • 知道可微点的次微分就是梯度。
  • 能够计算一些简单函数(如 , )的次微分。

实践应用

  • 最优性条件: 对于无约束凸优化问题, 是最优解的充要条件是 。这是梯度为零条件向非光滑函数的推广。
  • 次梯度算法: 一种简单的非光滑凸优化算法,它在每一步迭代时使用一个任意的次梯度来代替梯度进行更新。

关联知识点