Learning Structure-Semantic Evolution Trajectories for Graph Domain Adaptation¶
会议: ICLR 2026
arXiv: 2602.10506
代码: DiffGDA
领域: 其他
关键词: 图域适应, 扩散模型, SDE, 连续演化, 域感知引导
一句话总结¶
提出DiffGDA——首个将扩散模型引入图域适应(GDA)的方法,用随机微分方程(SDE)建模源图到目标图的连续时间结构-语义联合演化过程,配合基于密度比的域感知引导网络驾驶扩散轨迹朝向目标域,理论证明收敛到最优适应路径,在8个真实数据集14个迁移任务上全面超越SOTA。
研究背景与动机¶
问题定义:图域适应(GDA)旨在将有标注源图(source graph)的知识迁移到无标注目标图(target graph),解决跨域分布偏移问题,本文聚焦节点级GDA任务。
现有范式:GDA两大范式——(1) 模型导向方法(学习域不变表示,如MMD、对抗训练),假设结构变化有限,在大结构差异下失效;(2) 数据导向方法(构建中间图桥接结构gap),依赖离散对齐步骤,灵活但受限于步数固定。
离散对齐的根本局限:真实世界图的结构受社交动态、引用增长、知识扩散等复杂过程驱动,演化是连续且非线性的。固定步数的离散对齐无法逼近实际的变换过程,特别是面对无标注图时,结构和语义缺乏显式锚点可供对齐。
连续演化的优势:连续时间建模(1)将结构变化表示为平滑时序轨迹,灵活适配非线性异构拓扑;(2)语义信息沿变换路径连续演化,模型自动学习最优对齐轨迹。
扩散模型的契机:扩散模型在捕捉复杂分布变换方面已取得巨大成功,SDE框架可将跨图迁移表示为连续概率流——自然统一结构与语义适应。
研究空白:现有图扩散模型主要关注对称扩散过程(生成任务),GDA需要非对称扩散(从源域到目标域的定向迁移),此前无人探索将扩散引入GDA领域。
方法详解¶
整体框架¶
DiffGDA把"从源图迁移到目标图"重新表述成一段连续时间的随机演化:先用前向SDE把带标注的源图逐步加噪到高斯分布,再用反向SDE从噪声采样回来,但反向过程不复原源图、而是被一个域感知引导网络牵引着朝目标域分布演化,落点是一张自带伪标签的中间图 \(\mathbf{G}'\)。最后在这张中间图上训练GNN分类器(交叉熵 + MMD对齐),并联合优化扩散与分类参数,从而把适应到的知识用于无标注目标图的节点分类。整条流水线可拆成「前向加噪 → 引导反向采样 → 中间图分类」三段,其中反向采样被密度比引导网络牵引、由分解后的 score 网络落地:
%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
IN["带标注源图<br/>+ 无标注目标图"]
D1["标签注入的<br/>前向扩散"]
NOISE["高斯噪声分布"]
D2["密度比引导的<br/>反向扩散"]
D3["无需标注的<br/>密度比估计<br/>(域判别器)"]
D4["特征/结构分解<br/>与选择性扩散"]
GP["中间图 G'<br/>(自带伪标签)"]
GNN["GNN 分类器<br/>(交叉熵 + MMD 对齐)"]
OUT["目标图节点分类"]
IN --> D1 --> NOISE --> D2 --> GP --> GNN --> OUT
D3 -->|引导力梯度| D2
D4 -->|score 网络落地| D2
关键设计¶
1. 标签注入的前向扩散:让中间图天生带标签
普通图扩散只对特征/结构加噪,源域的标注在采样后就丢了,还得额外做标签传播。DiffGDA把节点特征 \(\mathbf{X}^{\mathcal{S}}\) 与标签 \(\mathbf{Y}^{\mathcal{S}}\) 沿通道维拼成增广特征 \(\tilde{\mathbf{X}}^{\mathcal{S}} = [\mathbf{X}^{\mathcal{S}} \,\|\, \mathbf{Y}^{\mathcal{S}}] \in \mathbb{R}^{N_{\mathcal{S}} \times (F+C)}\),让标签和特征一起参与前向SDE \(\mathrm{d}\mathbf{G}^{\mathcal{S}}_t = \mathbf{f}_t(\mathbf{G}^{\mathcal{S}}_t)\mathrm{d}t + g_t(\mathbf{G}^{\mathcal{S}}_t)\mathrm{d}\mathbf{w}\) 的加噪与反向恢复。这样反向采样出的中间图 \(\mathbf{G}'=(\mathbf{X}',\mathbf{A}',\mathbf{Y}')\) 直接携带标签维度,省去单独的标签传播,也让后续监督有了现成的锚点。
2. 密度比引导的反向扩散:把"生成目标图"改成"被牵引着演化"
难点在于目标域无标注、缺乏对齐锚点,单纯反向恢复只会退回源图分布。DiffGDA的反向SDE在标准 score 项外,额外注入一个朝目标域的引导力。其理论依据是定理1:目标图的最优扩散网络满足
第一项是源图自身的 score function(由 score 网络 \(\mathbb{P}(\boldsymbol{\ell})\) 估计 \(\nabla\log p_t\)),第二项是目标/源分布密度比 \(q/p\) 的对数梯度——它正是把轨迹推向目标域的引导信号,由引导网络 \(\mathbb{Q}(\boldsymbol{\delta})\) 学习。这个分解的好处是:从源图出发、保留源域标注,又能凭密度比梯度连续地朝目标域演化,而不是凭空生成目标图。
3. 无需标注的密度比估计:用域判别器替代未知的真实密度
密度比 \(q/p\) 涉及目标域真实分布,本不可直接计算。DiffGDA转而训练一个GNN分类器 \(\mathcal{C}_{\text{gnn}}\) 去区分节点来自源域还是目标域,再用其输出概率 \(\mathbf{y}(\mathbf{x})\) 把密度比近似为 \(q/p \approx (1-\mathbf{y}(\mathbf{x}))/\mathbf{y}(\mathbf{x})\)。这把"估计两个高维分布之比"这个硬问题,化简成了一个只需无标注样本就能训练的二分类问题,让引导信号可落地。
4. 特征/结构分解与选择性扩散:兼顾建模精度和算力
图同时含连续节点特征和离散邻接结构,单一网络难以兼顾。DiffGDA把 score 网络拆为 \(\mathbb{P}(\boldsymbol{\ell}_1)\)(节点特征 score,用 MLP+GNN)和 \(\mathbb{P}(\boldsymbol{\ell}_2)\)(邻接结构 score,用 MLP+图多头注意力 GMH),引导网络同样拆为特征域估计 \(\mathbb{Q}(\boldsymbol{\delta}_1)\) 与结构域估计 \(\mathbb{Q}(\boldsymbol{\delta}_2)\)(均为轻量 MLP),各管一摊。同时用超参 \(\alpha\) 控制扩散比例,只对一部分节点施加扩散,在保留原始信息和控制显存/时间开销之间取平衡——这也是它能比同类图生成方法省一半运行时间的来源。
损失函数 / 训练策略¶
拿到带标注的中间图 \(\mathbf{G}'=(\mathbf{X}',\mathbf{A}',\mathbf{Y}')\) 后,GNN分类器在交叉熵监督之外再加一项MMD对齐,把中间图表征拉近到目标图表征:
其中 \(\eta\) 平衡两项;扩散网络与GNN参数端到端联合优化,演化轨迹和下游分类相互校准。
实验结果¶
表1: Citation域6个迁移任务(Mi-F1/Ma-F1)¶
| 方法 | A→C | A→D | C→A | C→D | D→A | D→C | 平均 |
|---|---|---|---|---|---|---|---|
| GCN | 70.82 | 65.05 | 65.44 | 69.46 | 59.92 | 66.83 | 64.83 |
| UDAGCN | 80.68 | 74.66 | 73.46 | 76.97 | 69.36 | 77.81 | 75.03 |
| A2GNN(AAAI'24) | 80.93 | 75.94 | 75.09 | 77.16 | 73.21 | 79.72 | 75.97 |
| TDSS(AAAI'25) | 80.41 | 74.04 | 72.88 | 77.23 | 72.38 | 79.04 | 75.72 |
| GAA(ICLR'25) | 80.03 | 73.32 | 73.15 | 76.04 | 68.32 | 78.27 | 72.65 |
| DiffGDA | 82.28 | 76.70 | 75.75 | 78.11 | 74.55 | 80.71 | 77.58 |
表2: Airport域6个迁移任务(Mi-F1/Ma-F1)¶
| 方法 | U→B | U→E | B→U | B→E | E→U | E→B | 平均 |
|---|---|---|---|---|---|---|---|
| AdaGCN | 65.65 | 50.63 | 46.87 | 54.44 | 48.62 | 73.74 | 56.17 |
| GraphAlign(KDD'24) | 62.54 | 52.18 | 50.33 | 55.23 | 54.35 | 71.02 | 56.39 |
| TDSS(AAAI'25) | 67.43 | 52.05 | 47.62 | 51.80 | 46.08 | 55.73 | 49.24 |
| DiffGDA | 71.76 | 54.18 | 54.37 | 57.15 | 56.20 | 74.81 | 60.75 |
运行时间对比(表3)¶
| 方法 | A→D总时间(s) | A→D Mi-F1 | A→C总时间(s) | A→C Mi-F1 |
|---|---|---|---|---|
| UDAGCN | 83.19 | 67.52 | 104.91 | 72.64 |
| GraphAlign | 269.65 | 70.14 | 297.15 | 76.62 |
| DiffGDA | 126.73 | 73.41 | 125.41 | 80.23 |
DiffGDA比同为图生成的GraphAlign减少50%以上运行时间,同时性能更优。
关键发现¶
-
连续优于离散:DiffGDA在所有14个迁移任务上一致超越基于离散中间图的方法(GraphAlign、GGDA),证明连续时间演化建模在捕捉非线性结构差异方面的根本优势。
-
引导网络是关键:消融实验(Figure 2)显示,移除域感知引导网络导致最大性能下降(特别是B→E等高难度任务)——单纯的无引导扩散无法自动朝目标域方向演化。
-
三组件互补:引导网络稳定扩散路径、MMD促进跨域对齐、邻接约束保持结构依赖——三者缺一不可。
-
扩散步数的选择较鲁棒:T=40-80步即可收敛,过大T收益递减;采样比例α需根据图规模调整(大图受限于显存需用小α)。
-
表征空间更清晰:t-SNE可视化(Figure 5)显示DiffGDA生成更紧凑、分离更好的类簇,有效消除域无关噪声,增强类间可区分性。
亮点¶
- "首次将扩散引入GDA"——开创性地用SDE扩散过程统一建模结构+语义适应,为GDA开辟全新范式
- 密度比引导的精巧设计——不是从噪声直接生成目标,而是从源图出发,用密度比梯度引导扩散轨迹→保留源域标注的同时朝目标域演化
- 标签注入扩散——将标签拼接到特征中参与扩散→生成的中间图自带标签→无需额外标签传播
- 理论+实践双强——既有最优解收敛的理论证明(Theorem 1),又在14个任务上全面超越
- 选择性扩散——仅对部分节点扩散(α控制比例),兼顾效率和信息保留
局限性¶
- 可扩展性受限:大规模图受显存限制只能用小采样比例(α),Airport域任务中50%以上即OOM,大图场景实用性存疑
- MMD对齐的额外开销:扩散生成后还需MMD对齐→说明扩散本身未能完全消除域差距,需要两阶段配合
- 损失权重η敏感:η增大性能持续下降→过强对齐导致过度正则化→实际使用需精细调参
- 仅验证节点分类:未在图分类、链接预测等其他图任务上验证泛化性
相关工作对比¶
| 维度 | GraphAlign(KDD'24) | DiffGDA |
|---|---|---|
| 对齐方式 | 构建离散中间图 | SDE连续演化 |
| 适应范式 | 数据导向(固定步数) | 生成式(连续时间) |
| 典型性能(Citation Avg) | 67.41 | 77.58 |
| 运行时间 | 最慢(图生成开销大) | 减少50%+ |
| 维度 | A2GNN(AAAI'24) | DiffGDA |
|---|---|---|
| 核心思路 | 对抗+注意力聚合 | 扩散+域引导 |
| 适应范式 | 模型导向 | 生成式(数据导向) |
| Citation Avg | 75.97 | 77.58 |
| Airport Avg | 49.57 | 60.75 |
| 结构差异适应 | 中等 | 强(连续非线性建模) |
| 维度 | GAA(ICLR'25) | DiffGDA |
|---|---|---|
| 核心思路 | 图增强+对齐 | SDE扩散+域引导 |
| Citation Avg | 72.65 | 77.58 |
| Airport Avg | 51.98 | 60.75 |
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 首次将扩散模型引入GDA,用SDE连续演化替代离散对齐,开创性工作
- 实验充分度: ⭐⭐⭐⭐⭐ 8数据集14任务、16个baseline、消融/参数分析/效率对比/可视化齐全,显著性检验(p<0.05)
- 写作质量: ⭐⭐⭐⭐ 数学推导清晰,框架图直观,公式符号统一
- 实用价值: ⭐⭐⭐⭐ 为连续图域适应开辟新范式,但大图可扩展性仍需改进