Learning Adaptive Distribution Alignment with Neural Characteristic Function for Graph Domain Adaptation¶
会议: ICLR 2026
arXiv: 2602.10489
代码: https://github.com/gxingyu/ADAlign
领域: 其他 / 图神经网络
关键词: 图域适应, 特征函数, 谱域对齐, 自适应频率采样, minimax优化
一句话总结¶
提出ADAlign框架,利用神经特征函数在谱域自适应对齐源/目标图分布——无需手动选择对齐标准,自动识别每个迁移场景中最显著的分布差异。在10个数据集16个迁移任务上达SOTA,同时降低内存和训练时间。
研究背景与动机¶
图域适应(GDA)旨在将有标签源图的知识迁移到无标签目标图。分布偏移的来源复杂多样——节点属性差异、度分布差异、同质性差异等往往交织在一起。现有方法依赖人工设计的图滤波器提取特定特征(如属性或结构统计量)再对齐,但不同迁移场景中主导差异不同,固定策略难以适应。
如Figure 1可视化所示,三个Airport迁移任务中最大KL散度对应的特征维度完全不同——B-E中feature 2,3最大,U-E中feature 1,2,4最大。固定对齐某几个特征无法捕获所有场景的完整偏移。
核心创新:用特征函数(CF)在谱域统一表示分布差异——CF唯一确定概率分布(Thm 2)且可自适应地在频域中寻找最信息量的频率成分进行对齐(NSD + learnable frequency sampler)。
方法详解¶
整体框架¶
GNN编码器 → 特征函数变换 → Neural Spectral Discrepancy (NSD) → Adaptive Frequency Sampler → minimax优化。
关键设计¶
-
特征函数变换:将源/目标图嵌入Z^S, Z^T的经验分布转换到频域:Ψ(t) = E[exp(it^T z)]。CF唯一确定分布(Thm 2)且convergence保证(Thm 1)。
-
Neural Spectral Discrepancy (NSD):NSD = ∫ |Ψ^S(t) - Ψ^T(t)|² dF_T(t)。分解为amplitude差异(全局结构变化)和phase差异(关系对齐偏移),系数κ控制平衡。
-
Adaptive Frequency Sampler:用normal scale mixture参数化采样分布 p_T(t;φ)。通过minimax训练:φ最大化NSD(找到最大差异的频率),δ最小化NSD(对齐分布)。
-
minimax优化 (Eq 14):min_δ max_φ [L_source + λ·L_align]。GNN参数δ优化分类+对齐,采样参数φ对抗性寻找最大差异频率。
损失函数 / 训练策略¶
L = L_source(CE) + λ·L_align(NSD)。L_align通过Monte Carlo采样M个频率点近似。reparameterization trick保证采样可微。
实验关键数据¶
主实验(部分展示)¶
| 任务 | GAT | GCN | UDAGCN | DEAL | ADAlign | 说明 |
|---|---|---|---|---|---|---|
| A→C (Citation) | 62.8 | 69.2 | 72.1 | 74.3 | 76.8 | +2.5 |
| C→D (Citation) | 67.1 | 68.1 | 71.5 | 73.2 | 75.4 | +2.2 |
| B1→B2 (Blog) | 21.2 | 20.5 | 23.1 | 24.8 | 28.3 | +3.5 |
消融实验¶
| 组件 | 效果 | 说明 |
|---|---|---|
| 去掉adaptive sampler(fixed频率) | 显著下降 | 自适应是关键 |
| 去掉phase alignment | 下降 | 两者都重要 |
| 去掉amplitude alignment | 下降 | 互补信息 |
| κ=0 (仅phase) vs κ=1 (仅amplitude) | 都不如κ=0.5 | 需要平衡 |
效率比较¶
| 方法 | 内存(MB) | 训练时间(s) | 说明 |
|---|---|---|---|
| DEAL | 1,245 | 892 | 重型GNN对齐 |
| FLAN | 987 | 756 | 滤波器设计 |
| ADAlign | 423 | 312 | 轻量谱域操作 |
关键发现¶
- ADAlign在16/16个迁移任务上达到最优或接近最优。
- 内存和训练时间分别降低2-3倍——CF操作比GNN-based对齐更轻量。
- 自适应频率采样在不同场景自动聚焦不同谱成分——验证了设计初衷。
- PAC-Bayesian分析(Thm 3 + Prop 1)为NSD提供了泛化理论支持。
亮点与洞察¶
- 特征函数为图分布对齐提供了统一、完备的理论工具——不需要手动选择对齐什么。
- 振幅/相位分解有直觉意义:振幅≈全局统计量差异,相位≈关系结构差异。
- minimax中的frequency sampler是"对抗性搜索最大差异"的自然表达。
- 效率优势使框架实用性更强。
局限与展望¶
- Monte Carlo近似的频率采样引入方差,M的选择需要权衡。
- 仅在节点分类任务验证,图级任务待探索。
- κ的选择目前是超参,自适应κ可能更优。
- 对极端domain gap的处理能力需进一步测试。
相关工作与启发¶
- 将特征函数从生成模型/知识蒸馏引入GDA,开辟了新的方法空间。
- 自适应谱域对齐的思路可推广到其他domain adaptation任务。
评分¶
- 新颖性: ⭐⭐⭐⭐ 特征函数+谱域对齐+自适应采样
- 实验充分度: ⭐⭐⭐⭐⭐ 10数据集16任务+消融+效率分析
- 写作质量: ⭐⭐⭐⭐ 数学推导清晰
- 价值: ⭐⭐⭐⭐ GDA方法论的有意义贡献