知识点:线搜索方法
知识点概述
线搜索是设计迭代优化算法的一个基本框架。在每一步迭代中,算法首先确定一个下降方向,然后沿这个方向进行一维搜索(线搜索),以找到一个合适的步长,使得目标函数值有“足够”的下降。
详细解释
- 迭代框架:
- 下降方向 (Descent Direction) : 一个使得函数值在当前点 附近可以下降的方向。对于可微函数,只要满足 ,就是一个下降方向。例如,最速下降方向 。
- 步长 (Step Length) : 沿着方向 移动的距离。
- 线搜索的任务: 确定步长 。
- 精确线搜索: 求解 。这本身是一个一维优化问题,计算成本高,实践中很少使用。
- 非精确线搜索: 寻找一个能让函数值有“满意下降”且计算成本不高的步长。
- Armijo-Wolfe 条件: 一组保证步长“足够好”的常用准则。
- Armijo 条件 (Sufficient Decrease): (其中 )。保证函数值有足够的下降,防止步长太小。
- Wolfe 条件 (Curvature Condition): (其中 )。保证步长不会太小,排除了函数值下降不明显的点。
学习要点
- 理解迭代优化的“方向+步长”框架。
- 区分精确线搜索和非精确线搜索。
- 掌握Armijo-Wolfe条件是保证算法收敛性的关键。
实践应用
- 几乎所有基于梯度的一阶和二阶优化算法(如梯度下降、拟牛顿法)都依赖于线搜索策略来确定步长。
关联知识点
- 前置知识: 12-核心概念-迭代算法, 51-理论方法-无约束可微问题最优性条件
- 后续知识: 57-理论方法-梯度下降法, 60-理论方法-牛顿法, 61-理论方法-拟牛顿法
- 相关知识: 62-理论方法-信赖域算法