跳转至

🔗 因果推理

🧠 NeurIPS2025 · 21 篇论文解读

📌 同领域跨会议浏览: 💬 ACL2026 (8) · 📷 CVPR2026 (4) · 🔬 ICLR2026 (18) · 🤖 AAAI2026 (10) · 📹 ICCV2025 (2) · 🧪 ICML2025 (16)

🔥 高频主题: LLM ×3

A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning

提出基于多智能体影响图(MAIDs)的目标干预范式(Targeted Intervention),通过仅对单个目标智能体施加预策略干预(Pre-Strategy Intervention, PSI),引导整个多智能体系统收敛到满足额外期望结果的优选Nash均衡,无需对所有智能体进行全局干预。

An Analysis of Causal Effect Estimation Using Outcome Invariant Data Augmentation

首次系统分析"结果不变数据增强"(outcome invariant DA)在因果效应估计中的作用,证明当 DA 操作保持结果变量的不变性时等价于对处理变量的软干预,可减少混杂偏差;进一步提出 IV-like(IVL)回归框架,将 DA 参数用作"类工具变量",通过对抗性 DA 组合进一步降低偏差。

Bi-Level Decision-Focused Causal Learning for Large-Scale Marketing Optimization

提出 Bi-DFCL,通过双层优化框架联合利用观测数据和 RCT 实验数据来训练营销资源分配模型:上层用 RCT 数据的无偏决策损失端到端训练 Bridge Network 来动态纠正下层在观测数据上的偏差,同时设计了基于原始问题的可微代理决策损失(PPL/PIFD)和隐式微分算法,解决了传统两阶段方法的预测-决策不一致和偏差-方差困境。已在美团大规模在线部署。

Causality-Induced Positional Encoding for Transformer-Based Representation Learning of Non-Sequential Features

CAPE 通过从表格数据中学习特征间的因果DAG结构,将其嵌入双曲空间生成因果感知的旋转位置编码(RoPE),使 Transformer 能处理非序列但因果相关的特征数据,在多组学数据的下游任务上显著提升性能。

Conformal Prediction for Causal Effects of Continuous Treatments

首次为连续处理变量(如药物剂量)的因果效应构建共形预测区间,通过倾向性偏移参数化和分位数回归,在已知/未知倾向性两种场景下均提供有限样本 \(1-\alpha\) 覆盖保证。

Counterfactual Reasoning for Steerable Pluralistic Value Alignment of Large Language Models

提出COUPLE框架,通过构建结构因果模型(SCM)建模多维价值观的依赖关系与优先级,并利用反事实推理实现LLM对任意细粒度多元价值目标的可控对齐。

Cyclic Counterfactuals under Shift–Scale Interventions

本文在循环(非DAG)结构因果模型中建立了shift-scale软干预下反事实推理的理论框架,证明了全局收缩条件保证循环SCM的唯一可解性,并推导出反事实分布的sub-Gaussian集中不等式。

Demystifying Spectral Feature Learning for Instrumental Variable Regression

为基于谱特征的非参数工具变量(NPIV)回归建立严格的泛化误差界,揭示性能由结构函数与条件期望算子的谱对齐(近似误差)和奇异值衰减速度(估计误差)两因素共同决定,提出 Good-Bad-Ugly 三分类法并设计数据驱动诊断工具。

Differentiable Structure Learning and Causal Discovery for General Binary Data

提出基于多元伯努利分布(MVB)的通用可微结构学习框架,不假设特定数据生成过程,能捕获二值离散变量间的任意高阶依赖关系,并证明在一般设定下DAG不可识别但可恢复最小等价类(Markov等价类)。

Do-PFN: In-Context Learning for Causal Effect Estimation

提出 Do-PFN,将 Prior-data Fitted Networks (PFN) 扩展到因果效应估计,在大量合成 SCM 数据上预训练 Transformer 进行 in-context 因果推理,仅需观测数据即可预测干预分布(CID)和 CATE,无需因果图知识或不混杂假设,在合成和半合成实验中表现出色。

Domain-Adapted Granger Causality for Real-Time Cross-Slice Attack Attribution in 6G Networks

提出一种面向6G网络切片的域适应Granger因果框架,将增强型Granger因果检验与网络资源争用建模相结合,实现实时跨切片攻击归因,在1100个攻击场景上达到89.2%准确率和87ms响应时间,显著超越现有统计、深度学习和因果发现方法。

Few-Shot Knowledge Distillation of LLMs With Counterfactual Explanations

提出 CoD(Counterfactual-explanation-infused Distillation),通过将反事实解释注入少样本训练集来精确映射 teacher 决策边界,在 6 个数据集上仅用 8–512 样本即显著超越标准蒸馏方法。

From Black-box to Causal-box: Towards Building More Interpretable Models

提出"因果可解释性"(causal interpretability)的形式化定义,证明黑盒模型和概念瓶颈模型均不满足该性质,给出完整的图判据确定哪些模型架构能一致地回答反事实问题,揭示了因果可解释性与预测精度之间的根本性权衡。

GST-UNet: A Neural Framework for Spatiotemporal Causal Inference with Time-Varying Confounding

提出 GST-UNet,将 U-Net 时空编码器与迭代 G-computation 相结合,从单条时空观测轨迹中估计位置特异性的条件平均潜在结果 (CAPO),可同时处理干扰(interference)、空间混杂、时间延续和时变混杂,并在加州山火烟雾对呼吸系统住院率的因果分析中验证了实用价值。

It's Hard to Be Normal: The Impact of Noise on Structure-agnostic Estimation

证明 Double Machine Learning (DML) 在高斯处理噪声下是极小极大最优的(\(O(\epsilon^2 + n^{-1/2})\)),但在非高斯噪声下变得次优;提出 Agnostic Cumulant-based Estimation (ACE) 利用高阶累积量达到 \(r\) 阶不敏感性 \(O(\epsilon^r + n^{-1/2})\)

LLM Interpretability with Identifiable Temporal-Instantaneous Representation

本文提出了一种面向 LLM 高维激活空间的可辨识时序因果表示学习框架,通过线性化公式同时建模时间延迟和瞬时因果关系,在保留理论可辨识性保证的同时解决了现有 CRL 方法无法扩展到 LLM 维度的计算瓶颈。

Performative Validity of Recourse Explanations

本文形式化分析了追索权解释(recourse explanations)的"表演性"效应——当大量被拒申请者按照追索建议行动时,集体行为会引发数据分布偏移并使模型更新后追索失效,并证明了只有基于因果变量的改进型追索(ICR)才能在广泛条件下保持"表演性有效性"。

Practical do-Shapley Explanations with Estimand-Agnostic Causal Inference

提出 Estimand-Agnostic(EA)方法和 Frontier-Reducibility Algorithm(FRA)来高效计算因果 Shapley 值(do-SV),通过训练单个 SCM 学习观测分布即可回答任意可辨识的因果查询,并通过联盟约减将计算量降低约 90%。

Revealing Multimodal Causality with Large Language Models

提出 MLLM-CD 框架,首次实现从多模态非结构化数据(文本+图像)中进行因果发现,通过对比因子发现识别因果变量、统计方法推断因果结构、迭代多模态反事实推理消除结构歧义。

Root Cause Analysis of Outliers with Missing Structural Knowledge

提出仅用边际异常分数即可做根因分析的两个简单高效算法——已知因果图时用 SMOOTH TRAVERSAL(沿因果路径找分数跳变最大的节点),未知因果图时用 SCORE ORDERING(按分数排序取 top-k),在 polytree 结构下给出非参数概率保证,仅需单个异常样本即可工作。

Transferring Causal Effects using Proxies

提出基于代理变量(proxy)的多域因果效应迁移方法,在目标域仅观测到代理变量 W 的条件下,利用多源域数据识别并估计目标域中含未观测混淆因子的干预分布,给出两种一致性估计器及渐近置信区间。