人性化的解释

知识点概述

一个数学上或技术上“正确”的解释,不一定是一个对人类“好”的解释。人性化的解释借鉴了社会科学的研究成果,探讨了什么样的解释更符合人类的认知习惯,从而更容易被理解和接受。

教材原文

让我们更深入挖掘,发现人类所认为的“好的”解释,以及对可解释机器学习的意义。人文科学研究可以帮助我们找到答案。Miller (2017) 对有关解释的出版物进行了大量调查研究,本节以他的总结为基础。 …作为事件的解释,人类更喜欢简短的解释(只有1或2个原因),这些解释将当前的情况与事件不会发生的情况进行了对比,特别是异常原因提供了很好的解释。

详细解释

一个好的、人性化的解释通常具备以下特征:

1. 解释是对比性的 (Contrastive)

  • 核心思想: 人类通常不会问“为什么事件Y发生了?”,而是问“为什么事件Y发生了,而不是事件Z?”。我们习惯于在反事实的情境中思考。
  • 例子: 当贷款被拒绝时,我们不想知道所有影响分数的因素,而是想知道“我需要改变什么才能让贷款被批准?”。我们关心的是“被拒绝的我”和“能被批准的我”之间的差异
  • 对IML的启示: 好的解释应该突出当前实例与某个参照点(可以是平均水平,也可以是另一个实例)之间的差异。40-理论方法-反事实解释就是这种思想的直接体现。

2. 解释是选择性的 (Selective)

  • 核心思想: 人类不希望得到一个包含了所有原因的、冗长的完整解释。我们更偏爱只包含一到两个最重要原因的简短解释。
  • 例子: 新闻报道会将股市下跌归咎于一两个主要原因,而不是罗列所有复杂的经济因素。
  • 对IML的启示: 解释应该力求简洁。像36-理论方法-局部代理(LIME)这样的方法,通过选择少数几个最重要的特征来生成局部解释,就很好地体现了选择性。

3. 解释是社会性的 (Social)

  • 核心思想: 解释是一个发生在解释者和被解释者之间的社会过程。解释的内容和形式应该根据听众的知识背景和所处的社会环境进行调整。
  • 例子: 向一个技术专家解释加密货币和向你的祖母解释加密货币,需要用完全不同的话语体系。
  • 对IML的启示: 在设计解释系统时,必须充分考虑目标受众是谁,以及解释的目标是什么(是建立信任?还是帮助调试?)。

4. 解释关注异常 (Abnormal)

  • 核心思想: 人类倾向于用异常的、不太可能发生但确实发生了的事件来解释结果。
  • 例子: 一个平时从不提问的老师突然进行了一次突击测试,导致一个没准备的学生挂科了。比起“学生没准备”,一个更好的解释是“因为老师出人意料地进行了测试”。
  • 对IML的启示: 如果一个预测的输入特征是罕见的或异常的,并且它对预测有显著影响,那么它应该被包含在解释中,即使其他“正常”特征有同样大的影响。

5. 解释是真实的,但更重要的是与先验知识一致

  • 真实性 (Truthfulness): 好的解释当然应该是真实的,即忠实于模型的行为(高保真度)。
  • 与先验知识一致 (Coherent with Priors): 人类有确认偏误,倾向于接受与自己已有知识和信念一致的解释,而排斥不一致的信息。
  • 对IML的启示: 这在可解释性中是一个两难的困境。有时模型为了追求更高的准确率,可能会学到一些与人类直觉相悖的复杂关系。在构建解释时,可能需要在模型的“真实性”和人类的“接受度”之间做出权衡。例如,可以对模型施加单调性约束,强制特征的影响方向与人的直觉一致。

学习要点

  • 理解人性化解释的核心特征:对比性、选择性、社会性和对异常的关注。
  • 认识到“好的解释”不仅仅是技术问题,也是一个认知科学和社会科学问题。
  • 知道在设计可解释性方案时,需要在模型的真实行为和人类的认知习惯之间找到平衡。

关联知识点