知识点:无约束不可微问题最优性条件

知识点概述

对于不可微的凸函数,梯度的概念被次梯度取代。最优性条件也从“梯度为零”推广为“零是次微分的一个元素”。

详细解释

  • 背景: 许多重要的凸函数(如 范数 、Hinge损失)在某些点是不可微的,因此无法使用基于梯度的最优性条件。
  • 一阶充要条件:
    • 内容: 对于一个(不一定可微的)凸函数 ,点 是其全局最优解的充要条件
    • 直观: 在最优解 处,至少存在一个次梯度为零向量。这意味着我们可以从 画出一条“水平”的支撑超平面,整个函数图像都在该超平面的上方。
  • 与可微情况的联系: 如果函数 点可微,那么其次微分 只包含一个元素,即梯度 。此时, 就退化为 ,与可微情况的一阶必要条件一致。
  • 复合优化问题: 对于复合优化问题 光滑,非光滑凸),最优性条件为 ,或者等价地,

学习要点

  • 掌握非光滑凸函数的最优性条件:
  • 理解这是可微情况下 的直接推广。
  • 知道对于凸问题,这个条件是充要的。

实践应用

  • 算法终止条件: 次梯度下降等算法的终止条件可以是找到一个点的次梯度范数足够小。
  • 邻近梯度法: 求解复合优化问题的邻近梯度算法,其不动点方程 正是源于最优性条件

关联知识点