全局代理模型

知识点概述

全局代理模型（Global Surrogate Model）是一种模型无关的解释方法，其核心思想是：用一个简单的、可解释的模型（如线性回归、决策树）来近似一个复杂的、黑盒模型的全部预测行为。通过解释这个简单的代理模型，我们间接地理解了那个复杂的黑盒模型。

教材原文

全局代理模型是一种可解释的模型，经过训练可近似于黑盒模型的预测。我们可以通过解释代理模型得出有关黑盒模型的结论。通过使用更多的机器学习解决机器学习的可解释性！ … （可解释的）代理模型的目的是尽可能准确地近似底层模型的预测，并且可以同时进行解释。

详细解释

核心思想: “以其人之道，还治其人之身”。我们用一个简单的、我们能理解的“白盒”模型去模仿和学习一个复杂的、我们不理解的“黑盒”模型的决策逻辑。
算法流程:
1. 获取预测: 选择一个数据集（可以是原始训练集，也可以是新的数据集），并使用你想要解释的黑盒模型对这个数据集进行预测。
2. 创建新的训练集: 现在，你有了输入特征，以及黑盒模型给出的预测结果。忘记原始的真实标签，我们将黑盒模型的预测结果作为新的“目标变量”。
3. 训练代理模型: 在这个新的训练集（特征 + 黑盒模型的预测）上，训练一个你选择的可解释模型（例如，决策树、线性模型）。
4. 解释代理模型: 对这个训练好的、可解释的代理模型进行解释。例如，如果你的代理模型是决策树，你就可以通过可视化树结构或提取规则来理解黑盒模型的行为。
评估代理模型的质量:
- 代理模型能否很好地模仿黑盒模型至关重要。我们使用R-squared (R²) 来衡量代理模型在多大程度上“解释”了黑盒模型预测值的方差。
- $R^{2} = 1 - \frac{\sum ( y ^ _{surrogate} - y ^ _{blackbox} ) ^{2}}{\sum ( y ^ _{blackbox} - y ^ ˉ _{blackbox} ) ^{2}}$
- R²越接近1，说明代理模型模仿得越像，其解释也就越可靠。如果R²很低（如0.19），则说明代理模型未能捕捉黑盒模型的逻辑，其解释也就不可信。

学习要点

理解全局代理模型的核心是“用一个可解释模型去拟合一个黑盒模型的预测”。
掌握其训练流程：代理模型学习的目标是黑盒模型的预测，而不是数据的真实标签。
知道必须通过R-squared等指标来评估代理模型的“保真度”，以判断其解释的可靠性。
全局代理模型是一种非常灵活的模型无关方法。

优点

灵活性: 可以使用任何可解释模型作为代理，也可以解释任何黑盒模型。你可以为同一个黑盒模型训练一个决策树代理和一个线性模型代理，以提供不同形式的解释。
直观性: 这个方法非常直观，容易向非技术人员解释。
易于实现: 只需要有黑盒模型的预测接口即可，无需了解其内部。

缺点

结论的间接性: 你解释的是代理模型，而不是黑盒模型本身。你得出的结论总是关于“模型”，而不是关于“数据”或“现实世界”。
保真度问题: 代理模型可能无法完美地近似黑盒模型。没有一个明确的R²阈值来判断代理模型是否“足够好”。
可能产生误导: 如果代理模型的保真度不高，或者在某些数据子集上近似得很好，而在另一些子集上很差，那么基于它的全局解释可能会产生误导。

关联知识点

前置知识: 29-理论方法-模型无关方法, 14-理论方法-线性回归, 20-理论方法-决策树
后续知识: 36-理论方法-局部代理(LIME) (LIME可以被看作是一种“局部”的代理模型)

SWUFE Book Knowledge Graph

探索

35-理论方法-全局代理模型

全局代理模型

知识点概述

教材原文

详细解释

学习要点

优点

缺点

关联知识点

关系图谱

目录

反向链接