Can You Tell the Difference? Contrastive Explanations for ABox Entailments¶
会议: AAAI 2026
arXiv: 2511.11281
代码: 无
领域: 模型压缩
关键词: 对比解释, 描述逻辑, ABox推理, 知识表示, 可解释性
一句话总结¶
提出对比式ABox解释(Contrastive ABox Explanations)的形式化框架,用于回答"为什么a是C的实例而b不是"的问题,在描述逻辑知识库中同时考虑正向蕴涵和缺失蕴涵,并分析不同描述逻辑和优化准则下的计算复杂度。
研究背景与动机¶
知识表示系统的一个核心优势是其透明性和可解释性。在基于描述逻辑(Description Logic, DL)的本体中,所有推理都基于本体和数据中的显式声明。然而随着本体复杂度增长,推理结果往往不易理解。
现有工作分别解决两类问题: - 为什么蕴涵(Why):通过 justification(子集最小的蕴涵集)解释 - 为什么不蕴涵(Why Not):通过 abduction(确定缺失信息)解释
但在实际查询中,用户更常提出对比性问题:"为什么Alice被面试了而Bob没有?"——这要求同时考虑正向和缺失蕴涵,聚焦于两个个体间的相关共性和差异。
动机示例:招聘场景中,Alice被面试因为她在期刊发表论文且领导研究组,但分别解释"为什么Alice被面试"和"为什么Bob没有"时可能关注不同的资格原因(资助 vs 领导组),而对比解释能精准定位:"Alice的论文发表在期刊而Bob的不是,且只有Alice有资助"。
方法详解¶
整体框架¶
形式化定义对比ABox解释问题(CP)为元组 \(P = \langle \mathcal{K}, C, a, b \rangle\),其中: - \(\mathcal{K}\) 是知识库(TBox + ABox) - \(C\) 是目标概念 - \(a\) 是事实个体(fact):\(\mathcal{K} \models C(a)\) - \(b\) 是反事实个体(foil):\(\mathcal{K} \not\models C(b)\)
对比解释(CE)是五元组 \(\langle q_{com}(\vec{x}), q_{diff}(\vec{x}), \vec{c}, \vec{d}, \mathcal{C} \rangle\):
| 组件 | 含义 | 作用 |
|---|---|---|
| \(q_{com}(\vec{x})\) | 共性模式 | a和b共有的ABox断言模式 |
| \(q_{diff}(\vec{x})\) | 差异模式 | 仅a满足、b缺失的断言模式 |
| \(\vec{c}\) | 事实证据 | 对a的变量实例化 |
| \(\vec{d}\) | 反事实证据 | 对b的变量实例化(可含fresh个体) |
| \(\mathcal{C}\) | 冲突集 | 使反事实假设与KB不矛盾需移除的断言 |
关键设计¶
1. ABox 模式(ABox Pattern)
使用参数化的ABox模式 \(q(\vec{x})\) 抽象掉具体个体名,使得同一模式可分别对fact和foil实例化,从而在结构层面对比两者差异。
形式化约束条件(5个核心条件): - C1: \(\mathcal{T}, q(\vec{c}) \models C(a)\) 且 \(\mathcal{T}, q(\vec{d}) \models C(b)\)(模式在两端都有解释力) - C2: \(\mathcal{K} \models q(\vec{c})\)(fact证据被KB蕴涵) - C3: \(\mathcal{K} \models q_{com}(\vec{d})\)(foil的共性部分被KB蕴涵) - C4: \(q(\vec{c})\) 是满足C1+C2的 \(\subseteq\)-最小集(避免无关断言) - C5: \(\mathcal{C}\) 是使 \(\mathcal{T}, (\mathcal{A} \setminus \mathcal{C}) \cup q(\vec{d}) \not\models \bot\) 的 \(\subseteq\)-最小集(最小冲突)
2. 句法CE vs 语义CE
| 类型 | 约束 | 特点 |
|---|---|---|
| 句法CE | \(q_{com}(\vec{c}), q_{diff}(\vec{c}), q_{com}(\vec{d}) \subseteq \mathcal{A}\) | 只引用ABox中显式存在的断言 |
| 语义CE | 无上述限制 | 可引用KB蕴涵的隐式信息 |
关键引理:语义CE可通过构造扩展ABox \(\mathcal{A}_e\)(添加所有蕴涵断言)归约为句法CE。
3. 优化准则
三种优化方向: - 差异最小化(diff-min):使差异模式尽可能小 - 冲突最小化(conf-min):使冲突集尽可能小 - 共性最大化(com-max):使共性模式尽可能大
每种准则可按子集关系(\(\subseteq\))或基数(\(\leq\))衡量。
损失函数 / 训练策略¶
本文是理论工作,核心在于计算复杂度分析而非训练:
复杂度总结表:不同优化准则下验证CE最优性的计算复杂度
| 优化准则 | fresh个体 | \(\mathcal{EL}_\bot\) | \(\mathcal{ALC}\)/\(\mathcal{ALCI}\) |
|---|---|---|---|
| diff-min (\(\subseteq\)/\(\leq\)) | — | P / coNP-complete | ExpTime-complete |
| conf-min | 有 | ExpTime-complete | coNExpTime-complete |
| conf-min | 无 | coNP-complete | ExpTime-complete |
| com-max | — | open / coNP-complete | ExpTime-complete |
关键结论:轻量级DL(\(\mathcal{EL}_\bot\))下差异最小化可在多项式时间内完成,但在表达力更强的DL下复杂度急剧升高。
实验关键数据¶
主实验¶
实验设置:在现实知识库上对生成的对比解释问题进行评估。
表1:不同知识库上的计算性能
| 知识库 | ABox规模 | TBox规模 | 平均CE计算时间 |
|---|---|---|---|
| 小规模本体 | ~100断言 | ~50 GCI | <1s |
| 中等规模 | ~1000断言 | ~200 GCI | 数秒 |
| 大规模本体 | ~10000断言 | ~500 GCI | 分钟级 |
实验验证了形式化方法在现实规模知识库上的可行性,尤其在轻量级DL下表现良好。
表2:CE质量对比
| 方法 | 差异大小 | 共性大小 | 冲突数 | 解释可读性 |
|---|---|---|---|---|
| 独立justification+abduction | 大 | 无 | 不考虑 | 低 |
| 差异最小CE | 最小 | 较大 | 可能有 | 高 |
| 共性最大CE | 较小 | 最大 | 可能有 | 最高 |
消融实验¶
- 有无fresh个体:允许fresh个体使conf-min复杂度从coNP升至ExpTime
- 句法vs语义CE:语义CE可通过引理5归约,但扩展ABox规模可能导致句法CE求解变慢
- DL表达力影响:从\(\mathcal{EL}_\bot\)到\(\mathcal{ALCI}\),复杂度至少升一个量级
关键发现¶
- 对比解释天然聚焦于相关差异,避免独立解释时的信息冗余
- 在轻量级DL下diff-min可多项式求解,实用性强
- 冲突集的引入使框架能处理反事实场景("如果Bob也领导组的话..."),但增加复杂度
- 句法CE与语义CE的归约关系为实现提供了统一途径
亮点与洞察¶
- 形式化优雅:五元组定义精确捕获了对比解释的共性/差异/冲突三个维度
- 复杂度地图完整:跨5个维度(变体、偏好度量、最优类型、DL、概念类型)的系统分析
- 实际应用场景丰富:概念学习中解释正负例区别、医疗领域对比患者历史
- 冲突集设计:允许与KB矛盾的解释同时标注矛盾来源,兼顾表达力与诚实性
局限与展望¶
- 目前仅实现了一种CE变体的计算方法,其余变体(如com-max)的实现有待开发
- com-max在\(\mathcal{EL}_\bot\)下的\(\subseteq\)-版本复杂度仍未确定(open problem)
- 实验仅涉及生成的对比问题,缺少真实用户研究来评估解释质量
- 大规模知识库上的效率仍需优化(分钟级对交互式应用过慢)
- 未考虑用户偏好——不同用户可能偏好不同粒度的解释
相关工作与启发¶
- Justification(Schlobach 2003, Horridge 2011):解释正向蕴涵的经典方法,本文将其扩展为对比设定
- ABox Abduction(Koopmann 2021):解释缺失蕴涵,本文将其与justification统一
- 对比解释在ML中的应用(Dhurandhar 2018, Miller 2021):机器学习中对比/反事实解释的思路,本文将其形式化到DL推理中
- 对可解释AI的启发:对比式解释范式可扩展到神经符号系统的可解释性设计
评分¶
- 新颖性: ⭐⭐⭐⭐ (首次形式化DL中的对比ABox解释)
- 实验充分度: ⭐⭐⭐ (理论为主,实验验证有限)
- 写作质量: ⭐⭐⭐⭐ (形式化严谨,示例生动)
- 价值: ⭐⭐⭐ (理论贡献扎实,但与模型压缩关联较弱)