📖 NLP 理解¶
🤖 AAAI2026 · 2 篇论文解读
📌 同领域跨会议浏览: 💬 ACL2026 (27) · 🧠 NeurIPS2025 (2) · 📹 ICCV2025 (1) · 🧪 ICML2025 (1) · 💬 ACL2025 (30) · 🎞️ ECCV2024 (1)
🔥 高频主题: 推理 ×2
- Language Models and Logic Programs for Trustworthy Tax Reasoning
-
将税法推理重新定义为语义解析任务,让LLM将法规文本和纳税案例翻译为Prolog逻辑程序,由符号求解器执行计算,通过金标准法规+智能检索案例示例+自一致性检查,在SARA数据集上实现86/100的正确率,并将预计部署成本降至15.78美元/人(低于美国人均报税成本的6%)。
- Understanding Syllogistic Reasoning in LLMs from Formal and Natural Language Perspectives
-
系统评估14个LLM在160个三段论上的推理表现,通过双维度ground truth框架(句法有效性+NLU可信度)揭示顶级模型在形式逻辑上接近完美(99.6%)但自然语言可信度判断仅为随机水平(~52%)——与人类推理模式恰好相反;12/14模型存在显著信念偏差,且few-shot提示反而降低形式推理性能。