知识点:罚函数法
知识点概述
罚函数法是将约束优化问题转化为一系列无约束优化问题的经典方法。其核心思想是在目标函数中加入一个“惩罚项”,当迭代点违反约束时,该项会变得非常大,从而“惩罚”这种行为,迫使算法的解趋向于可行域。
详细解释
- 问题形式: s.t. 。
- 二次罚函数法:
- 模型: 将原问题转化为无约束问题 。
- 算法:
- 选择一个递增的惩罚因子序列 。
- 对于每一个 ,求解无约束问题 ,得到解 。
- 的序列极限就是原约束问题的解。
- 直观: 当惩罚因子 趋于无穷大时,为了最小化 ,约束违反项 必须趋于零,即解必须趋于满足约束。
- 缺点:
- 数值病态: 当 非常大时,罚函数的海瑟矩阵会变得非常病态(条件数很大),使得无约束子问题的求解变得非常困难。
- 非精确可行: 算法得到的解通常只是近似满足约束,而不是严格满足。
学习要点
- 理解罚函数法将约束问题转化为无约束问题的核心思想。
- 掌握二次罚函数的构造形式。
- 了解罚函数法的算法流程(逐步增大惩罚因子)。
- 知道其主要缺点是会导致数值病态问题。
实践应用
- 由于其数值不稳定的缺点,单纯的罚函数法在现代优化中已较少直接使用,但其思想是后续更先进算法(如增广拉格朗日法)的基础。
关联知识点
- 前置知识: 7-核心概念-无约束和约束优化, 54-理论方法-一般约束优化问题最优性条件
- 后续知识: 65-理论方法-增广拉格朗日函数法
- 相关知识: 无