Which bird does not have wings: Negative-constrained KGQA with Schema-guided Semantic Matching and Self-directed Refinement¶

会议: ACL 2026
arXiv: 2604.14749
代码: https://github.com/midannii/CUCKOO
领域: 图学习 / 知识图谱问答
关键词: 知识图谱问答, 否定约束, 语义解析, 逻辑形式, Schema引导

一句话总结¶

本文提出了否定约束知识图谱问答（NEST KGQA）新任务和 NestKGQA 数据集，设计了 Python 格式逻辑形式 PyLF 来清晰表达否定约束，并提出 CUCKOO 框架通过约束感知草稿生成、Schema 引导语义匹配和自导向细化三个模块，在 few-shot 设置下实现了多约束问题的高效精确回答。

研究背景与动机¶

领域现状：知识图谱问答（KGQA）是利用外部知识减少 LLM 幻觉的重要方向。其中语义解析（SP）方法将自然语言问题映射为逻辑形式，再转换成 SPARQL 查询在知识图谱上执行，具有可解释性和忠实性优势。

现有痛点：现有 KGQA 基准和方法严重偏向正向约束和计算约束，忽略了否定约束。虽然一些数据集中看似包含"not"等否定词，但实际是比较操作。LLM 在否定推理方面本身就很脆弱，且现有逻辑形式（如 s-expression）难以清晰表达否定语义。

核心矛盾：否定约束在现实问题中频繁出现，但缺乏专门的基准和方法来处理。同时否定约束问题天然包含多个约束条件，使语义复杂度大幅增加，导致生成不可执行查询的风险显著升高。

本文目标：(1) 定义 NEST KGQA 新任务并构建 NestKGQA 数据集；(2) 设计能清晰表达否定的逻辑形式 PyLF；(3) 构建能处理多约束否定问题的高效框架。

切入角度：作者观察到现有 SP 方法的语义匹配采用暴力搜索，不考虑 KG schema 语义，导致候选逻辑形式数量指数级增长。通过利用 KG schema 约束来剪枝，可以同时提升效率和准确性。

核心 idea：用约束感知的草稿生成显式枚举问题中的约束元素，再用 Schema 引导的语义匹配将草稿锚定到 KG 上，最后仅在执行结果为空时触发自导向细化，实现低成本高鲁棒的否定约束问答。

方法详解¶

整体框架¶

CUCKOO 是一个"生成-匹配"范式的 KGQA 框架。输入自然语言问题，首先通过约束感知草稿生成模块提取约束元素并生成 PyLF 逻辑形式草稿；然后通过 Schema 引导语义匹配模块将草稿中的实体和关系映射到 KG 上的具体项，生成可执行的逻辑形式列表；将匹配结果转换为 SPARQL 执行；仅当执行返回空结果时，触发自导向细化模块修正草稿。

关键设计¶

PyLF（Python 格式逻辑形式）:
- 功能：提供一种既能清晰表达否定约束，又保持可读性的逻辑形式
- 核心思路：在 JOIN 函数中添加布尔参数 neg 来标记否定约束（如 JOIN('producing', 'Saturn', neg=True)），并用 R_ 前缀区分查询头实体还是尾实体，使语义解析更精确
- 设计动机：现有逻辑形式中只有 \(\lambda\) 演算能表达否定但可读性差，s-expression 可读但无法表达否定。PyLF 基于 Python 语法，LLM 在预训练中接触大量 Python 代码，语法错误率低
Schema 引导语义匹配:
- 功能：将逻辑形式草稿中的实体和关系提及映射到 KG 中的具体项，同时保证语义可执行性
- 核心思路：从 START 函数的主题实体开始，通过余弦相似度检索候选实体及其所属类别；然后提取包含候选类别的 schema 级三元组，用相似度阈值 \(\theta\) 筛选关系匹配；利用 schema 约束（domain/range）逐层传播类别信息，自动剪枝不合法的组合
- 设计动机：传统暴力匹配对每个实体取 top-\(K_e\)、每个关系取 top-\(K_r\)，候选数量为 \(K_e^n \cdot K_r^m\) 指数增长。Schema 引导方法利用类型约束大幅减少候选数，例如将 \(K_e^1 \cdot K_r^2\) 降至 \(1 \times 2 \times 2 = 4\)
自导向细化模块:
- 功能：修复格式错误或语义错误的逻辑形式草稿
- 核心思路：仅在查询执行结果为空时触发。首先从预定义错误类别中诊断问题类型（缺少约束分解、格式错误、函数语法错误等），然后通过 few-shot 示例引导 LLM 重新生成草稿，无需额外参数微调或外部执行反馈
- 设计动机：与现有代码生成方法依赖外部执行反馈和多轮 LLM 调用不同，CUCKOO 的细化是自包含的，减少了成本和延迟

损失函数 / 训练策略¶

CUCKOO 是基于上下文学习（in-context learning）的免训练框架。草稿生成使用 GPT-3.5-turbo 作为骨干 LLM，通过 SimCSE 嵌入从训练数据中检索 top-k 相似示例作为 few-shot 演示。候选生成数为 1 或 6，最终预测通过多数投票确定。

实验关键数据¶

主实验¶

数据集	指标	CUCKOO(6)	KB-Coder(6)	KB-BINDER(6)
GrailQA (Overall)	EM/F1	62.1/64.2	51.2/56.3	52.5/54.5
GrailQA (Zero-shot)	EM/F1	57.5/59.8	46.7/51.6	45.9/48.6
NestKGQA	F1	26.2	24.4	4.6
GraphQ	F1	40.8	35.8	32.7

消融实验¶

配置	GrailQA F1	NestKGQA F1	说明
CUCKOO 完整模型	64.2	26.2	完整模型
w/o 自导向细化	63.2	25.8	细化贡献约 1 个点
w/o 约束元素	61.3	24.4	显式约束分解有帮助
w/o Schema 引导匹配	56.6	16.3	核心模块，去掉后大幅下降

关键发现¶

Schema 引导语义匹配是最关键模块，去掉后 GrailQA 下降 7.6 点、NestKGQA 下降近 10 点
在多约束问题（3 个约束）上 CUCKOO 优势最明显，EM 达到最高
在 superlative 类型问题上实现了从 3.1 到 53.1 的巨大提升
所有零样本 LLM 在 NestKGQA 上表现远低于传统 KGQA，证明否定约束推理确实困难
CPU 内存比 KB-Coder 减少 4.7%，但推理时间增加约 1.6 倍

亮点与洞察¶

PyLF 通过在 JOIN 函数中添加 neg 布尔参数来表达否定，设计极其简洁却有效解决了否定约束表达的长期难题。这种"最小修改"思路值得借鉴——不需要发明全新的逻辑形式，只需在现有框架上做针对性扩展
Schema 引导匹配利用 KG 的类型系统进行候选剪枝，将指数级搜索空间降为多项式级。这个思路可以迁移到任何需要在结构化知识上做生成+验证的场景
自导向细化的"仅在失败时触发"策略是一个优雅的工程设计，避免了不必要的 LLM 调用

局限与展望¶

基于封闭世界假设，在开放世界场景下适用性有限
NestKGQA 数据集规模较小，是在已有基准上扩展的
假设 KG schema 完整可用，当 schema 不完整时需要额外的 schema 提取模型
性能依赖骨干 LLM 能力，未来需要探索模型无关策略

评分¶

新颖性: ⭐⭐⭐⭐ 首次系统定义否定约束 KGQA 任务，任务定义清晰，PyLF 设计简洁有效
实验充分度: ⭐⭐⭐⭐ 多个基准、消融、多维度分析，但 NestKGQA 数据集较小
写作质量: ⭐⭐⭐⭐ 结构清晰，motivating example 直观
价值: ⭐⭐⭐⭐ 填补了 KGQA 中否定约束处理的空白，Schema 引导匹配具有通用价值