全局代理模型
知识点概述
全局代理模型(Global Surrogate Model)是一种模型无关的解释方法,其核心思想是:用一个简单的、可解释的模型(如线性回归、决策树)来近似一个复杂的、黑盒模型的全部预测行为。通过解释这个简单的代理模型,我们间接地理解了那个复杂的黑盒模型。
教材原文
全局代理模型是一种可解释的模型,经过训练可近似于黑盒模型的预测。我们可以通过解释代理模型得出有关黑盒模型的结论。通过使用更多的机器学习解决机器学习的可解释性! … (可解释的)代理模型的目的是尽可能准确地近似底层模型的预测,并且可以同时进行解释。
详细解释
- 核心思想: “以其人之道,还治其人之身”。我们用一个简单的、我们能理解的“白盒”模型去模仿和学习一个复杂的、我们不理解的“黑盒”模型的决策逻辑。
- 算法流程:
- 获取预测: 选择一个数据集(可以是原始训练集,也可以是新的数据集),并使用你想要解释的黑盒模型对这个数据集进行预测。
- 创建新的训练集: 现在,你有了输入特征,以及黑盒模型给出的预测结果。忘记原始的真实标签,我们将黑盒模型的预测结果作为新的“目标变量”。
- 训练代理模型: 在这个新的训练集(特征 + 黑盒模型的预测)上,训练一个你选择的可解释模型(例如,决策树、线性模型)。
- 解释代理模型: 对这个训练好的、可解释的代理模型进行解释。例如,如果你的代理模型是决策树,你就可以通过可视化树结构或提取规则来理解黑盒模型的行为。
- 评估代理模型的质量:
- 代理模型能否很好地模仿黑盒模型至关重要。我们使用R-squared (R²) 来衡量代理模型在多大程度上“解释”了黑盒模型预测值的方差。
- R²越接近1,说明代理模型模仿得越像,其解释也就越可靠。如果R²很低(如0.19),则说明代理模型未能捕捉黑盒模型的逻辑,其解释也就不可信。
学习要点
- 理解全局代理模型的核心是“用一个可解释模型去拟合一个黑盒模型的预测”。
- 掌握其训练流程:代理模型学习的目标是黑盒模型的预测,而不是数据的真实标签。
- 知道必须通过R-squared等指标来评估代理模型的“保真度”,以判断其解释的可靠性。
- 全局代理模型是一种非常灵活的模型无关方法。
优点
- 灵活性: 可以使用任何可解释模型作为代理,也可以解释任何黑盒模型。你可以为同一个黑盒模型训练一个决策树代理和一个线性模型代理,以提供不同形式的解释。
- 直观性: 这个方法非常直观,容易向非技术人员解释。
- 易于实现: 只需要有黑盒模型的预测接口即可,无需了解其内部。
缺点
- 结论的间接性: 你解释的是代理模型,而不是黑盒模型本身。你得出的结论总是关于“模型”,而不是关于“数据”或“现实世界”。
- 保真度问题: 代理模型可能无法完美地近似黑盒模型。没有一个明确的R²阈值来判断代理模型是否“足够好”。
- 可能产生误导: 如果代理模型的保真度不高,或者在某些数据子集上近似得很好,而在另一些子集上很差,那么基于它的全局解释可能会产生误导。
关联知识点
- 前置知识: 29-理论方法-模型无关方法, 14-理论方法-线性回归, 20-理论方法-决策树
- 后续知识: 36-理论方法-局部代理(LIME) (LIME可以被看作是一种“局部”的代理模型)