知识点:线搜索方法

知识点概述

线搜索是设计迭代优化算法的一个基本框架。在每一步迭代中,算法首先确定一个下降方向,然后沿这个方向进行一维搜索(线搜索),以找到一个合适的步长,使得目标函数值有“足够”的下降。

详细解释

  • 迭代框架:
    • 下降方向 (Descent Direction) : 一个使得函数值在当前点 附近可以下降的方向。对于可微函数,只要满足 ,就是一个下降方向。例如,最速下降方向
    • 步长 (Step Length) : 沿着方向 移动的距离。
  • 线搜索的任务: 确定步长
    • 精确线搜索: 求解 。这本身是一个一维优化问题,计算成本高,实践中很少使用。
    • 非精确线搜索: 寻找一个能让函数值有“满意下降”且计算成本不高的步长。
  • Armijo-Wolfe 条件: 一组保证步长“足够好”的常用准则。
    1. Armijo 条件 (Sufficient Decrease): (其中 )。保证函数值有足够的下降,防止步长太小。
    2. Wolfe 条件 (Curvature Condition): (其中 )。保证步长不会太小,排除了函数值下降不明显的点。

学习要点

  • 理解迭代优化的“方向+步长”框架。
  • 区分精确线搜索和非精确线搜索。
  • 掌握Armijo-Wolfe条件是保证算法收敛性的关键。

实践应用

  • 几乎所有基于梯度的一阶和二阶优化算法(如梯度下降、拟牛顿法)都依赖于线搜索策略来确定步长。

关联知识点