ICLR 2026 因果推理同伴效应暴露映射函数网络干扰异质因果效应因果网络 motif 图神经网络

Learning Exposure Mapping Functions for Inferring Heterogeneous Peer Effects¶

会议: ICLR 2026
OpenReview: https://openreview.net/forum?id=bXYp5AIMju
代码: 待确认
领域: 因果推断 / 网络干扰 / 图神经网络
关键词: 同伴效应, 暴露映射函数, 网络干扰, 异质因果效应, 因果网络 motif, GNN

一句话总结¶

本文提出 EGONETGNN，用图神经网络自动学习网络同伴效应中的"暴露映射函数"（exposure mapping function），无需人工指定"被多少治疗过的邻居影响"，从而在影响机制未知、依赖局部结构（三角、聚类系数、属性相似度）时仍能稳健估计异质同伴效应。

研究背景与动机¶

领域现状：在社交网络、接触网络等场景里，一个个体的结果会被邻居的处理（treatment）影响，这叫"干扰"（interference）。因果推断刻画"同伴效应"（peer effect）时，依赖一个暴露映射函数 \(\phi_e\)，把"邻居的处理 + 网络结构"压缩成一个标量/低维"同伴暴露值"，再比较不同暴露值下的反事实结果之差。

现有痛点：这个映射函数几乎总是人工指定的——比如"是否有邻居被处理"（二值）、"被处理邻居的比例"、"线性阈值"、"按连边强度/属性相似度加权的比例"、"因果网络 motif 计数"等。但真实的影响机制几乎从不可知，一旦函数指定错误（misspecification），因果效应估计就会有偏。

核心矛盾：(1) 想自动学这个函数 → 现有工作直接套 GCN/GIN 这类标准消息传递 GNN（MPGNN），但理论已证明 MPGNN 数不出带环子图（如闭三角 motif），无法表达依赖局部结构（聚类系数、连通分量、共同好友数）的影响机制；(2) 人工提取因果网络 motif 计数虽然信息丰富，但计算昂贵、不灵活、且漏掉边权等上下文。

本文目标：彻底摆脱"人工定义暴露映射函数"，端到端自动学一个既能数清复杂局部 motif、又对无关上下文不敏感、还能输出有界且分布均匀的同伴暴露表示的函数，用于异质同伴效应（HPE）估计。

核心 idea（自动学暴露映射 + ego 网络变换提升表达力）：把每个节点的"节点回归"问题转成"图回归"——抽取该节点的 ego 网络（只含邻居及邻居间的边），使原来涉及 ego 的三角结构在 ego 网络里退化成 dyad（边），从而绕开 MPGNN 数不出闭三角的瓶颈；再配 masked weights、coverage/entropy/sparsity 等损失，保证表达力、不变性与表示质量三者兼得。

方法详解¶

整体框架¶

EGONETGNN 在标准"特征映射 + 反事实结果模型"两件套之上，新增一个绿色高亮的暴露映射函数学习模块。流程为：先用一个 MPGNN 把带属性网络编码成特征嵌入 \(c_i\)（管混杂/效应修饰）；再为每个节点抽 ego 网络、注入邻居处理与边属性、做节点级聚合捕获局部结构；经 masked weight 层和 MLP 编码后做图级 readout，得到有界的同伴暴露嵌入 \(\rho_i\)；最后把 \((\pi_i, \rho_i, c_i)\) 喂给 TARNet/CFR+ 反事实结果模型估计同伴效应。

flowchart LR
    A[带属性网络<br/>G,X,Z,t] --> B[特征映射 MPGNN<br/>得到 c_i]
    A --> C[抽取 ego 网络<br/>三角→dyad]
    C --> D[Peer Feature Encoder<br/>+ 节点级聚合]
    D --> E[Masked Weights<br/>过滤无关上下文]
    E --> F[Exposure Encoder MLP<br/>+ 图 readout]
    F --> G[同伴暴露嵌入 ρ_i ∈ 0,1 ^d]
    B --> H[反事实结果模型<br/>TARNet / CFR+]
    G --> H
    H --> I[异质同伴效应 δ_i]

关键设计¶

1. Ego 网络变换：把"数不出的三角"变成"数得出的边"，治本式提升表达力。 这是全文表达力的根基。标准 MPGNN 之所以失效，是因为节点 \(v_i\) 的同伴暴露常依赖邻居之间的局部结构（如被处理邻居构成几个闭三角），而 MPGNN 无法计数带环子图。EGONETGNN 为每个节点 \(v_i\) 抽取 ego 网络 \(\bar{G}_i(\bar{V}_i,\bar{E}_i)\)，其中 \(\bar{V}_i\) 只含 \(v_i\) 的邻居、\(\bar{E}_i\) 只含邻居之间的边。在这个子图里，原本"\(v_i\)–\(v_j\)–\(v_k\)"的闭三角因为 \(v_i\) 被移走，退化成"\(v_j\)–\(v_k\)"的 dyad，于是普通节点聚合就能数清它。作者据此证明 Proposition 2：EGONETGNN 足以表达全部 dyad、open triad、closed triad、open tetrad 这四类因果网络 motif——而这正是标准 MPGNN 做不到的。由于 \(v_i\) 本身不在 ego 网络里，它的边属性 \(Z_{ij}\) 被转成邻居的节点属性 \(\bar{X}_j = Z_{ij}\)，保证边权信息不丢。

2. 特征映射与 Peer Feature 编码：解耦自身属性、显式建模"自己与邻居的相似度"。 特征映射用一个解耦式 MPGNN，把节点自身属性的隐表示 \(\Theta_0(X_i)\) 和"聚合来的邻居+边属性" \(h_i^l\) 分开拼接，\(c_i = \Theta_0(X_i)\,\|\,h_i^l\)，使 \(c_i\) 能干净地充当混杂控制/效应修饰变量。Peer feature encoder 则显式编码 ego 与每个 peer 的特征距离：\(c_{ij} = \Theta_{\text{feat}}(c_j\,\|\,(c_i-c_j)^2)\)，让模型能捕获"属性相似度"类影响机制（如同性别邻居影响更大）。随后在 ego 网络上做节点聚合 \(h_j^l = h_j^{l-1} + \sum_{k\in N_j} h_k^{l-1}\)，初始 \(h_k^0 = t_k\,\|\,\bar{X}_k\,\|\,c_{ik}\,\|\,Z_{jk}\) 把邻居处理、属性、特征编码、边属性全部纳入。

3. Masked weights + log 变换编码：促不变性、塞进对"比例/尺度"的归纳偏置。 为了让表示对无关上下文不敏感（不变性），聚合后的隐状态 \(h_j^{\text{agg}} = \bar{X}_j\,\|\,c_{ij}\,\|\,h_j^L\) 先过一个掩码全连接层 \(h_j^{\text{mask}} = \text{ReLU}\big((\sigma(W_{\text{mask}})\odot W_{\text{agg}})\,h_j^{\text{agg}} + b_{\text{agg}}\big)\)，掩码 \(\sigma(W_{\text{mask}})\) 学着把无关维度关掉。再经 exposure encoder \(h_j^{\text{exp}} = \text{ReLU}(\Theta_{\text{exp}}(\ln(\text{ReLU}(\Theta_{\text{enc}}(h_j^{\text{mask}}))+1)))\)，其中 \(\ln\) 变换对 scale-free 网络的大值做重缩放，并引入"捕获比例（ratio）类机制"的归纳偏置。

4. 双路有界 readout + 四个先验损失：保证暴露表示有界、覆盖充分、可端到端学。 图 readout 用两路聚合得到 \(\rho_i\in[0,1]^d\)：一路是 \(\sum_j (t_j h_j^{\text{exp}})/\sum_j h_j^{\text{exp}}\)（类比"被处理邻居比例"，但权重由网络学），另一路是 \(1-e^{-\sum_j (t_j h_j^{\text{exp}})}\)（类比"被处理邻居数量"），二者天然落在 \([0,1]\)，\(0\) 表示无暴露。端到端损失把四类先验拧在一起：balance loss（CFR+ 的自编码重构 + Wasserstein IPM，平衡处理/控制组分布同时保表达力）、coverage loss \(L_{\text{cov}}=(\text{mean}(\rho)-0.5)^2+(\text{var}(\rho)-\tfrac{1}{12})^2+(\text{range}(\rho)-1)^2\)（逼近 \([0,1]\) 均匀分布、防"模式坍缩"）、entropy loss 把掩码逼向 0/1、sparsity loss 让少数掩码权重高。总损失 \(L=\tfrac1n\sum_i L_{y_i}+L_{\text{bal}}+\lambda_{\text{cov}}L_{\text{cov}}+\lambda_{\text{ent}}L_{\text{ent}}+\lambda_{\text{sp}}L_{\text{sp}}+\lambda_{L1}\|\Theta_{\text{gnn}}\|_1\)，末项 L1 进一步促稀疏/不变性。反事实结果模型用 TARNet（共享嵌入 + 双预测头）或自带自编码器的 CFR+（用重构损失缓解平衡表示时的表达力损失）。

实验关键数据¶

主实验表格¶

BlogCatalog 半合成数据，真实暴露机制分别依赖聚类系数、连通分量、共同好友、属性相似度时的 HPE 估计误差 \(\epsilon_{PEHE}\)（越低越好）：

机制	Ours-TARNet	Ours-CFR+	GNN-Motifs	INE-TARNet	1GNN-HSIC	DWR	NetEst	CauGramer
聚类系数	2.13±1.9	0.95±0.5	2.39±1.2	2.35±0.7	6.21±3.7	7.49±4.6	4.53±1.5	6.16±2.1
连通分量	1.47±0.9	1.50±0.7	4.98±1.6	4.78±1.1	6.78±1.9	7.68±1.6	8.56±0.7	7.07±1.2
共同好友	2.86±1.3	2.24±1.6	2.81±1.3	2.50±0.9	10.30±6.0	8.72±2.8	5.34±1.3	5.18±2.0
属性相似度	3.95±2.7	3.65±2.4	4.64±2.1	3.59±1.8	15.25±4.7	17.96±3.7	11.71±2.2	14.45±5.7

EGONETGNN 两个变体在四种机制中三种取得最佳，对依赖局部结构（连通分量、共同好友）的机制优势尤为明显；唯有属性相似度机制下 INE-TARNet 略优（因 homophily 使邻居属性近乎同质，简单基线占便宜）。

消融实验表格¶

三变体（完整 / 去 mask / 去 feature encoder+mask）的部分结果（去 feat&mask 行，\(\epsilon_{PEHE}\)）：

机制	BC(共同好友)	BA(共同好友)	WS(共同好友)	BC(聚类系数)	BA(聚类系数)	WS(聚类系数)	BC(属性相似)	BA(属性相似)	WS(属性相似)
Ours(去feat&mask)	2.07±1.3	0.27±0.2	0.31±0.1	2.11±0.8	0.97±0.7	1.91±1.3	3.18±1.9	13.73±2.8	13.85±4.0

结论：去掉 masked weights 会因对无关上下文敏感而引入偏差；去掉 feature encoder MLP 会削弱对属性相似度机制的捕获（属性相似列误差飙升）。但对纯局部结构机制，忽略无关特征反而更好——说明 feature encoder 增表达力、masked weights 促不变性，二者各司其职。

关键发现¶

RQ1（合成网络）：当偏好连接参数 \(m=1\)（稀疏星形、无环）时所有方法都行；但随边密度增大、出现复杂拓扑，基线因表达力不足急剧退化，EGONETGNN 在稠密网络上优势显著。
RQ4（表示质量，Table 3）：学到的暴露表示与真实暴露的绝对相关性，在聚类系数（0.81）、共同好友（0.73）等局部结构机制上远超"被处理好友比例"基线（0.17、0.09）。
RQ5（鲁棒性）：即使在所有基线假设都正确（真机制就是处理邻居比例）的最简设定下，本文方法仍因能处理复杂效应修饰和翻转反事实而更优；在 10% 特征置零+高斯噪声、两跳邻居干扰等假设被破坏的设定下也保持竞争力。
模型选择：用预测损失 + coverage loss 联合在 20% 验证集上选模型，比只用预测损失更稳健——coverage loss 防止暴露表示坍缩到"相关但非真实"的模式（类似防过拟合）。

亮点与洞察¶

把"暴露映射函数指定错误"这一因果推断长期痛点，转化为可端到端学习的表示学习问题，且不是简单套 GNN，而是从理论上诊断了 MPGNN 的表达力缺陷并对症下药。
Ego 网络变换是一个优雅的"治本"技巧：用图结构变换（三角→dyad）而非堆参数来获得 motif 计数能力，并给出 Proposition 2 的可证保证。
四个先验损失针对因果暴露表示的"专属病"：coverage loss 防表示坍缩、masked/entropy/sparsity 促不变性、balance loss 控混杂——把因果约束直接编码进损失，而非只靠数据拟合。
诚实的失败分析：明确指出属性相似度机制下因 homophily 简单基线反而占优、去特征反而更好等反直觉现象，没有粉饰。

局限与展望¶

理论仅覆盖表达力：主结果是 GNN 数 motif 的表达力 + 反事实预测误差的 misspecification 分解，但复杂 GNN 下异质因果效应估计的渐近性质/严格界仍未建立。
假设较强：依赖邻域干扰（仅一跳）、无混杂、需要可靠的带属性网络作输入；两跳干扰、噪声网络仅作鲁棒性测试而非理论保证。
计算开销：ego 网络处理使其平均比标准 MPGNN 贵约 \(\rho_E\times\text{avg}(d)\) 倍（边密度 × 平均度），稠密大图上的可扩展性待解。
效应类型单一：目前只估同伴效应，未涵盖直接效应、总效应等其他网络效应。
评测全靠合成/半合成：缺真实带 ground-truth 反事实的数据（这是因果推断的通病，但仍限制外部效度）。

评分¶

新颖性: ⭐⭐⭐⭐ 首次把"自动学暴露映射函数"与"GNN 表达力理论 + ego 网络变换"系统结合，并给出可证表达力保证，问题切入点新。
实验充分度: ⭐⭐⭐⭐ 3 类合成网络 + 2 个半合成网络、5 种机制、9+ 基线、5 个 RQ 含消融/表示质量/鲁棒性/模型选择，覆盖全面；扣分在全为合成数据、缺真实场景验证。
写作质量: ⭐⭐⭐⭐ 问题定义清晰、动机层层递进、理论与实验呼应；公式密集但符号统一，失败案例分析诚实。
价值: ⭐⭐⭐⭐ 缓解网络因果推断中暴露函数指定错误这一实际痛点，对社交/医疗/教育等需估同伴效应的领域有直接意义。