🕸️ 图学习¶
🔬 ICLR2026 · 118 篇论文解读
📌 同领域跨会议浏览: 📷 CVPR2026 (8) · 💬 ACL2026 (24) · 🧪 ICML2026 (35) · 🤖 AAAI2026 (37) · 🧠 NeurIPS2025 (54) · 📹 ICCV2025 (1)
🔥 高频主题: 图神经网络 ×14 · LLM ×7 · 扩散模型 ×6 · 推理 ×5 · 对齐/RLHF ×4
- A Graph Meta-Network for Learning on Kolmogorov–Arnold Networks
-
本文证明 Kolmogorov–Arnold 网络(KAN)和 MLP 共享同样的神经元置换对称性,据此把一个训练好的 KAN 编码成「KAN-graph」(节点是神经元、边携带那条边上一维函数的参数),并设计首个直接在 KAN 上做学习的权重空间架构 WS-KAN(一个双向消息传递 GNN),在预测精度、分类 INR、预测剪枝掩码等任务上大幅超过对称性无关的基线。
- Actions Speak Louder than Prompts: A Large-Scale Study of LLMs for Graph Inference
-
这是一篇大规模、可控的实证研究,系统对比 LLM 处理文本图的三种"交互模式"——直接 prompting、ReAct 式工具调用、以及让 LLM 写代码查图的 Graph-as-Code——发现让 LLM 自己写代码操作图(而不是把图塞进 prompt)在节点分类上整体最强,尤其在长文本、高度数的稠密图上优势巨大,并且它能在结构、特征、标签三种信号间自适应地切换依赖。
- Adaptive Mixture of Disentangled Experts for Dynamic Graph Out-of-Distribution Generalization
-
针对动态图上"分布偏移本身会随时间演化"这一现象,本文提出 AdaMix:用一个时空分布探测器实时感知每个时刻的偏移,再用原型引导的解耦专家混合(多种 GNN 架构当专家)按偏移自适应路由,最后用分布感知干预机制挖掘不变模式,在真实与合成动态图数据集上显著超过固定架构的 SOTA。
- AdaSpec: Adaptive Spectrum for Enhanced Node Distinguishability
-
本文从"节点可区分性"角度刻画谱 GNN 的表达能力,证明可区分节点数的下界由图矩阵的不同特征值个数与节点特征的非零频率分量个数共同决定,并据此提出即插即用的自适应图矩阵生成模块 AdaSpec,在不提升计算复杂度阶数、保持置换等变的前提下显著增强谱 GNN 区分异配图节点的能力。
- AdS-GNN - a Conformally Equivariant Graph Neural Network
-
这篇论文把点云从平直欧氏空间"抬升"到高一维的反德西特(AdS)空间,借助物理里 AdS 等距变换 ⇔ 边界共形变换的对应关系,构造出第一个对完整共形群(含平移、旋转、缩放,乃至非仿射的特殊共形变换)等变的图神经网络 AdS-GNN,并在超像素 MNIST、形状分割和 Ising 模型关联函数等任务上展现出更强的尺度泛化能力,还能从训练好的网络里直接读出共形维数这种物理上有意义的普适量。
- Are We Measuring Oversmoothing in Graph Neural Networks Correctly?
-
指出广泛使用的Dirichlet energy指标无法在实际场景中正确捕获GNN过平滑现象,提出以特征表征的数值秩/有效秩(effective rank)作为替代度量。在深度2–24、各深度独立训练的设定下,Erank与准确率的平均相关性达0.91(且方向一致为正),而Dirichlet energy平均仅−0.72、相关方向在数据集间反复横跳(在大规模OGB-Arxiv等场景下尤其失效);并从理论上证明对线性及非负权重的非线性GNN族其特征矩阵数值秩收敛到1(秩坍塌),从而把过平滑重新定义为秩坍塌而非特征向量对齐。
- AtlasKV: Augmenting LLMs with Billion-Scale Knowledge Graphs in 20GB VRAM
-
AtlasKV 把知识图谱里的每条三元组直接转成 Q-K-V 数据并以注意力的方式注入 LLM,再用层次化键值剪枝把复杂度从线性压到次线性,从而在 20GB 显存内为 LLM 接入十亿级(1B triples)知识图谱,无需外部检索器、无需长上下文、也无需为新知识重训。
- Atomic HINs: Entity-Attribute Duality for Heterogeneous Graph Modeling
-
本文提出"实体-属性对偶"原理,把异构信息网络(HIN)里所有属性原子化为实体节点得到一个"原子 HIN"作为表达力最大的标准形,再用遗传算法在节点/边类型上做二元选择(schema refinement),让一个极简版 RGCN(sRGCN)就能在 8 个数据集的节点分类和链接预测上达到 SOTA。
- Beyond Entity Correlations: Disentangling Event Causal Puzzles in Temporal Knowledge Graphs
-
本文提出 HEDRA,第一个在时序知识图谱(TKG)事件级别做异质因果解耦的表示学习框架,通过反事实检测、工具变量引导、演化正交三个模块逐级剥离非因果、伪因果,并分离动态/静态因果,在五个真实数据集上取得 SOTA。
- Beyond Simple Graphs: Neural Multi-Objective Routing on Multigraphs
-
首次提出针对多重图(multigraph)的神经组合优化路由方法 GMS,包含直接在多重图上边级自回归构造的 GMS-EB 和先学习剪枝再节点级路由的双头 GMS-DH 两个变体,在非对称多目标 TSP 和 CVRP 上实现了接近精确求解器 LKH 的性能且速度快数十倍。
- Bridging Input Feature Spaces Towards Graph Foundation Models
-
ALL-IN 用「随机高斯投影 + 节点协方差算子」把维度/语义/取值范围各不相同的图节点特征统一成一个与原始特征空间无关的共享表示,让单个预训练 GNN 无需改架构、无需重训就能迁移到带全新输入特征的未见数据集。
- Bridging ML and Algorithms: Comparison of Hyperbolic Embeddings
-
这是一篇"打通学术壁垒"的实证基准论文:作者把机器学习、网络理论、算法三个长期互不引用的社区里的 14 种双曲嵌入方法放到 38 个真实网络 + 600 个模拟网络上同台竞技,发现 2016 年算法社区的近线性 BFKL 算法比 ML 社区当红的 Poincaré/Lorentz 嵌入快约 100 倍、质量却相当甚至更好,并提出一个会惩罚高维高半径的新质量指标 ICV。
- Bures-Wasserstein Flow Matching for Graph Generation
-
针对现有图生成扩散/流模型「把节点和边拆开各自线性插值」导致概率路径不平滑、训练采样都难收敛的问题,本文用马尔可夫随机场(MRF)把图建模成一个相互耦合的彩色高斯系统,再用图分布之间的最优传输(Bures-Wasserstein)位移构造出一条平滑、闭式、仿真无关的概率路径,得到流匹配框架 BWFlow,在平面图与分子生成上取得更好性能、更快收敛和更高效采样。
- Canonical Tree Cover Neural Networks for Expressive and Invariant Graph Learning
-
针对"把图压成单条序列做正则化(canonicalization)会扭曲图上距离、且表达力被节点标注器卡死"这两个老毛病,本文提出 CTNN:把图表示成一组规范化的生成树覆盖(canonical spanning tree cover),每棵树用表达力强的递归树编码器处理再聚合,理论上既保不变性、又更好地保距离、还严格强于序列正则化,在稀疏分子/蛋白图分类上稳定超过不变 GNN 和序列正则化基线。
- CheckMate! Watermarking Graph Diffusion Models in Polynomial Time
-
CheckWate 是第一个面向图扩散模型的采样期水印框架:它把水印藏进噪声隐变量的特征值里(特征值对图同构不变),从而绕开图同构(GI)和图编辑距离(GED)这两个 NP-hard 障碍,做到 \(O(N^3)\) 多项式时间的水印验证,在四个数据集、四种图攻击下都能稳定检出,而把图像/表格水印硬搬到图上的基线在同构攻击下几乎全军覆没。
- CLAUSE: Agentic Neuro-Symbolic Knowledge Graph Reasoning via Dynamic Learnable Context Engineering
-
CLAUSE 把知识图谱多跳问答中"该检索什么上下文"本身当成一个带预算的序列决策问题,用三个协作的神经符号智能体(建子图 / 走路径 / 选证据)在「边数 / 步数 / token」三类资源约束下联合优化,配合提出的 LC-MAPPO 约束式多智能体 PPO 训练,单个 checkpoint 就能按每条 query 的预算或价格调节"精度–时延–成本"权衡,无需重训。
- Compactness and Consistency: A Conjoint Framework for Deep Graph Clustering
-
CoCo 用图卷积滤波从局部(邻接图)和全局(图扩散矩阵)两个视图提取互补的节点表示,再用一个共享的低秩子空间把两视图压成紧致嵌入以去冗余去噪(紧致性),最后用跨视图的相似度分布一致性损失打通两边语义(一致性),在五个图聚类基准上全面超过现有 SOTA。
- Confident Block Diagonal Structure-Aware Invariable Graph Completion for Incomplete Multi-view Clustering
-
针对部分视图缺失的不完整多视图聚类(IMVC),本文用一个"置信块对角正则"约束所有视图恢复出严格一致的局部块对角结构,再用跨视图的"不变图补全"项把缺失实例的真实结构推断回来,最后联合学一个共识谱聚类表示,在 BBCSport、COIL-20、Caltech-7、BUAA 等基准上全面超过现有 IMVC 方法。
- Constant Degree Matrix-Driven Incomplete Multi-View Clustering via Connectivity-Structure and Embedding Tensor Learning
-
CAMEL 把"图连通性约束"和"潜在嵌入张量的低秩约束"统一进同一个目标,并用一个常数度矩阵 \(D=\beta I\) 替换 Laplacian 里随数据变化的度矩阵,把度矩阵构造从 \(O(n^2)\) 降到 \(O(1)\),在不做 SVD 后处理的前提下直接对潜在嵌入跑 k-means,九个不完整多视图数据集上又快又准。
- Contraction and Hourglass Persistence for Learning on Graphs, Simplices, and Cells
-
本文指出主流 GNN 里基于"只往里加子图"(inclusion-based forward PH)的持续同调存在表达力与度量缺陷,提出用"收缩"(contraction)反向杀死永生拓扑特征,并把包含与收缩交错排列成 Hourglass Persistence,在严格证明表达力更强、可度量、稳定的同时给出可微算法,插进 GNN 后在多个图数据集上稳定超越已有 PH 方法。
- Controllable Logical Hypothesis Generation for Abductive Reasoning in Knowledge Graphs
-
本文提出 CtrlHGen,把知识图谱上的溯因推理(从观测实体反推合理逻辑假设)升级成"可控"任务——让用户能指定假设的语义方向和结构复杂度;通过子逻辑分解的数据增强缓解"长假设样本稀缺"、用 Dice/Overlap 平滑的语义奖励加上条件遵循奖励缓解"奖励过敏",在三个 KG 数据集上既更服从控制信号、语义相似度也优于 baseline。
- Cooperative Sheaf Neural Networks
-
提出在有向图上定义 cellular sheaf 的 in/out-degree Laplacian,构建 Cooperative Sheaf Neural Network (CSNN),使节点能独立选择信息传播/接收策略,从而同时缓解过度挤压(oversquashing)和处理异配(heterophilic)任务。
- CORDS - Continuous Representations of Discrete Structures
-
把"预测数量未知的一组对象"这件事统一改写成连续场上的推断:CORDS 用一个可逆映射把离散对象集编码成一个密度场(编码位置与个数)加一个特征场(携带属性),模型全程在场空间里学习,需要时再精确解码回离散集合,从而在分子生成、目标检测、仿真推断等任务里无需 padding、也无需专门的计数头就能处理可变基数。
- DAMR: Efficient and Adaptive Context-Aware Knowledge Graph Question Answering with LLM-Guided MCTS
-
DAMR 把 KGQA 建成一棵由 LLM 规划器引导扩展的蒙特卡洛树搜索:LLM 只在扩展步选 top-k 相关关系把搜索空间剪小,路径打分交给一个轻量 Transformer 评分器(交叉注意力联合编码问题与关系序列),并用搜索过程中产生的伪路径在线微调这个评分器;最终在 WebQSP(Hits@1 94.0)和 CWQ(78.0)上超越所有 SOTA,同时把 LLM 调用次数和 token 消耗分别砍掉 50%+ 与 75%+。
- DHG-Bench: A Comprehensive Benchmark for Deep Hypergraph Learning
-
DHG-Bench 是首个面向超图神经网络(HNN)的综合性基准,在统一实验协议下从有效性、效率、鲁棒性、公平性四个维度系统评测了 17 个 SOTA HNN 算法 × 22 个数据集(覆盖节点/超边/超图三种粒度任务),用大量对照实验揭示了现有 HNN「换数据换任务就崩」「大图跑不动」「特征/标签噪声扛不住」「比 MLP 更不公平」等系统性短板。
- Differentiable Lifting for Topological Neural Networks
-
提出 ∂lift(DiffLift)——一个端到端可学习的图"提升"(lifting)框架,用 GNN 节点嵌入参数化"候选高阶 cell 的分布",再用伯努利采样 + 直通估计器决定哪些 cell 进入拓扑结构,从而把原本靠先验启发式确定的 hypergraph / simplicial / cell complex 结构变成由下游任务监督学出来,在 12 个数据集、4 种 TNN 上较静态提升最高提升约 45%。
- Directed Semi-Simplicial Learning with Applications to Brain Activity Decoding
-
本文提出 Semi-Simplicial Neural Networks (SSNs)——第一个直接在「半单纯集」上运行的拓扑深度学习模型,用面映射诱导的关系代数统一并超越了图、有向图与单纯复形上的各类网络,理论上严格更强表达力,并在生物真实皮层微回路的脑刺激解码任务上把第二名模型甩开最高 27%、把消息传递 GNN 甩开最高 50%。
- Discrete Bayesian Sample Inference for Graph Generation
-
本文提出 GraphBSI,把贝叶斯样本推断(BSI)从连续数据推广到离散类别数据,让模型在「概率单纯形上的分布参数空间」里迭代精化对图的信念而非直接演化离散图,并把这一过程写成一族可调噪声 \(\gamma\) 的 SDE,在 Moses、GuacaMol 分子生成基准上以一次性(one-shot)方式取得 SOTA。
- Diverse and Sparse Mixture-of-Experts for Causal Subgraph–Based Out-of-Distribution Graph Learning
-
DiSCO 把图分布外(OOD)泛化里"找因果子图"的任务交给一组专家(MoE),每个专家抽出一个不同的候选因果子图,再用一个学到的稀疏门控为每个样本挑出最对路的那个专家;它不需要环境标签、也不假设虚假子图与标签独立,在 GOOD 基准上拿到平均第一。
- DR-GGAD: Dual Residual Centering for Mitigating Anomaly Non‑Discriminativity in Generalist Graph Anomaly Detection
-
针对"训练好的图异常检测器迁移到新图后,正常/异常节点表示纠缠在一起"这个老大难问题,本文先提出一个可量化的指标 AnD(异常不可分性)把它说清楚,再用"不直接比较节点、而是让每个节点和两个域不变残差中心比"的双残差中心化(Hyper Residual + Affinity Residual)来缓解它,参数冻结、零目标域微调,在 8 个目标图上平均 AUROC 比之前最好的通用方法高 5.14%。
- Dual-Branch Representations with Dynamic Gated Fusion and Triple-Granularity Alignment for Deep Multi-View Clustering
-
DREAM 把多视图聚类里被长期"偏科"对待的语义信息和结构信息,分别用 VAE 分支和 GCN 分支显式解耦成两路平行表示,再用门控融合自适应地按数据集调配两者权重,最后用"跨视图 / 样本内 / 簇间"三粒度对齐拉齐异构嵌入空间,在六个基准上全面超越八个 SOTA。
- Dynamic Multi-sample Mixup with Gradient Exploration for Open-set Graph Anomaly Detection
-
针对"训练时只见过少数几类异常、推理时要抓出从没见过的新异常"这一开集图异常检测难题,本文提出 DEMO:用动态多样本 Mixup 把已见异常融合出更多样的合成异常来撑开决策边界,用能量梯度反馈动态给每个样本重新加权,再用记忆库引导的类自适应阈值做可靠伪标签,在 6 个图数据集上稳定超过一众 GAD baseline。
- Efficient Learning on Large Graphs using a Densifying Regularity Lemma
-
本文提出"相交块图"(IBG)——一种把有向稀疏大图用 \(K\ll N\) 个相交二部块叠加表示的低秩分解,并证明了一个"致密化"版本的弱正则引理,使所需块数 \(K\) 只依赖近似精度而与图规模/稀疏度无关,从而让基于 IBG 的神经网络以 \(O(N)\)(而非 \(O(E)\))的时空复杂度在节点分类、时空预测和知识图谱补全上达到 SOTA。
- \(\ell_1\) Latent Distance Based Continuous-Time Graph Representation
-
用 ℓ1 距离替换现有连续时间图表示中违反三角不等式的平方 ℓ2 距离,推导出闭合形式的分段指数积分,并通过次梯度方法解决不可微难题,在 11 个数据集的三类评估任务上全面超越 GRASSP 等 8 个基线。
- Entropy-Guided Dynamic Tokens for Graph-LLM Alignment in Molecular Understanding
-
提出 EDT-Former(Entropy-guided Dynamic Token Transformer),通过熵引导的动态token生成机制,在冻结图编码器和LLM之间建立高效对齐,无需微调LLM主干网络即在分子问答、分子指令和属性预测等多个基准上达到SOTA。
- Escaping the Homophily Trap: A Threshold-free Graph Outlier Detection Framework via Clustering-guided Edge Reweighting
-
针对图卷积在异常检测中因"邻居聚合"把正常节点表征污染成异常的"同质性陷阱",本文提出 CER-GOD:用一个可学习掩码自适应削弱异质邻居之间的边权,再用一个二聚类检测器在无监督下生成伪标签来反过来指导掩码、并直接给出无需阈值的异常分数,配上一个多样性损失防止聚类塌缩,在 8 个基准上刷出新 SOTA(Email 数据集 AUC 96.98%,比次优高 12% 以上)。
- EvA: Evolutionary Attacks on Graphs
-
用精心设计的遗传算法直接在离散的边翻转空间里搜索对抗扰动,绕开梯度松弛与可微代理损失,在节点分类攻击上比 SOTA 的 PRBCD 平均再掉约 11% 准确率,并首次实现对保形预测和鲁棒性证书的图结构攻击。
- Exchangeability of GNN Representations with Applications to Graph Retrieval
-
本文发现并证明了一个全新的概率对称性——经标准训练的 GNN 节点嵌入在维度轴上是可交换随机变量,并利用这一性质把高维传输相似度近似成一维排序后的欧氏相似度,从而首次为非对称图相似度设计出统一的 LSH 检索框架 GraphHash。
- Federated Graph-Level Clustering Network with Dual Knowledge Separation
-
FGCN-DKS 把每张图拆成「面向聚类的共享不变子图」和「客户端私有的个性化子图」,只上传不变子图的模式摘要到服务器,再用图核计算簇间亲和度做个性化聚合,从而解决联邦图级聚类里"想共享一切反而导致服务器共识失败"的难题。
- FLOCK: A Knowledge Graph Foundation Model via Learning on Random Walks
-
FLOCK 用"采样随机游走→匿名化成序列→序列模型编码→共识池化"的范式替代了知识图谱基础模型(KGFM)惯用的消息传递与确定性等变约束,靠概率性节点-关系等变在保住跨图泛化的同时打破对称、区分"结构同构但语义相反"的关系,是 link-invariant 函数的通用逼近器,在 54 个 KG 上取得 SOTA。
- FlowSymm: Physics–Aware, Symmetry–Preserving Graph Attention for Network Flow Completion
-
把"缺失流补全"这个反问题拆成两半——先用一组保持节点守恒、且不动已观测边的代数群作用张成可行解子空间,再用图注意力在这个物理合法的基里挑选修正方向,最后用一个可微的 Tikhonov 凸求解器吸收噪声,从而在补全缺失流的同时严格不破坏物理守恒律。
- Forest-Based Graph Learning for Semi-Supervised Node Classification
-
把图上的消息传递重新诠释为「在若干棵生成树(森林)上的传输」,用同配性引导采样高质量树 + 线性时间的树聚合器,在 O(n+m) 复杂度下实现全局感受野,半监督节点分类上同时打败深层 GNN 和图 Transformer。
- FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing
-
把等变网络里经典的"参数共享"方案推广到 KAN 上,提出按群作用共享可学习单变量函数(而非标量权重)的 FS-KAN,统一了已有各种等变 KAN,并证明其表达力与参数共享 MLP 等价,从而在低数据场景下取得显著更高的样本效率。
- FSD-CAP: Fractional Subgraph Diffusion with Class-Aware Propagation for Graph Feature Imputation
-
针对图节点特征极端稀疏(缺失率高达 99.5%)的补全问题,FSD-CAP 用一个可调"锐度"的分数阶扩散算子做局部自适应传播、用从已观测节点逐层向外扩张的渐进式子图扩散抑制误差累积,再用伪标签 + 邻域熵驱动的类感知传播注入语义结构,让补全后的特征在节点分类和链路预测上逼近甚至超过用完整特征训练的 GCN。
- Full-Graph vs. Mini-Batch Training: Comprehensive Analysis from a Batch Size and Fan-Out Size Perspective
-
这篇论文把 GNN 的全图训练(full-graph)看作 batch size 与 fan-out size 都取到最大的 mini-batch 训练特例,从这两个超参数的视角同时做收敛、泛化、计算效率的理论与实证分析,得出一个反直觉结论:全图训练并不总是优于精心调参的小 batch mini-batch 训练。
- G-Merging: Graph Models Merging for Parameter-Efficient Multi-Task Knowledge Consolidation
-
G-Merging 面向多任务图学习场景,把多个从同一预训练 GNN 微调得到的任务模型先用任务算术合成共享骨干,再用拓扑感知对齐训练轻量任务适配器,并在推理时用无需训练的 MoE 路由动态组合适配器,从而用接近单模型的参数开销保留多任务知识。
- GDGB: A Benchmark for Generative Dynamic Text-Attributed Graph Learning
-
针对"动态文本属性图(DyTAG)生成"这一空白,作者构建了 8 个高质量文本数据集的 GDGB 基准,定义了 TDGG(直推式)和 IDGG(归纳式)两个新生成任务及多维评测协议,并提出 LLM 多智能体框架 GAG-General 作为可复现的统一基线。
- Gelato: Graph Edit Distance via Autoregressive Neural Combinatorial Optimization
-
GELATO 将图编辑距离的近似求解改写为逐步构造节点匹配的自回归决策过程,用带匹配历史的 GNN 反复选择下一个源图-目标图节点对,在多个 GED benchmark 上同时取得更高的精确命中率和更快的推理速度。
- Geometric Constraints for Small Language Models to Understand and Expand Scientific Taxonomies
-
把"父→查询→子"的层级传递性约束编码到双曲空间,再用冻结 LLM 补语义上下文,让一个 110M 的 DistilBERT(SS-MONO)在科学分类体系扩展任务上全面超过 GPT-4o mini、Gemma-2-9B 等冻结大模型和领域专用基线。
- Geometric Graph Neural Diffusion for Stable Molecular Dynamics Simulations
-
把图热扩散方程引入几何图神经网络,用「等变梯度算子 + 等变扩散算子」在全连接分子图上做全节点对信息流动,作为即插即用模块捕捉对构象变化不敏感的几何拓扑不变特征,从而让机器学习力场在未见构象上仍能稳定地跑长程 MD 模拟。
- Glance for Context: Learning When to Leverage LLMs for Node-Aware GNN-LLM Fusion
-
针对文本属性图,本文不再把 LLM 均匀地用在所有节点上,而是用一个轻量路由器只在 GNN 容易翻车的"异配(heterophilous)/低度数"节点上"瞄一眼"LLM,再用反事实优势信号训练这个不可微的路由决策,在显著减少 LLM 调用的同时把异配节点准确率最多拉高 +13%。
- Global-Recent Semantic Reasoning on Dynamic Text-Attributed Graphs with Large Language Models
-
DyGRASP 用 LLM 的隐式推理抓"近期语义依赖"、用显式推理抓"全局语义演化",再与时序 GNN 融合,在动态文本属性图(DyTAG)上把目的节点检索 Hit@10 最高提升 34%,并将 LLM 推理复杂度从 \(O(|E|\cdot d)\) 降到 \(O(|E|)\)。
- Global and Local Topology-Aware Graph Generation via Dual Conditioning Diffusion
-
DualDiff 把图同时拆成节点级(局部)和聚类级(全局)两条扩散支路,并用一套「双向条件」机制让全局与局部信息在去噪过程中交替互为条件,从而在统一隐空间里联合建模 \(p(Z_l, Z_g)\),显著提升了通用图与分子图的生成质量。
- gLSTM: Mitigating Over-Squashing by Increasing Storage Capacity
-
本文把 GNN 的 over-squashing 拆成"灵敏度受限"和"存储容量饱和"两个独立失效模式,提出能单独度量容量瓶颈的 NAR 合成任务,并把 xLSTM 的关联记忆/门控机制搬进消息传递,构造出显式扩大节点存储容量的 gLSTM 架构。
- GNN-as-Judge: Unleashing the Power of LLMs for Graph Learning with GNN Feedback
-
让带结构归纳偏置的 GNN 充当"裁判",利用 LLM 与 GNN 预测的一致/不一致信号筛选可靠伪标签,再用"指令微调 + 偏好微调"的弱监督算法把伪标签知识蒸馏进 LLM,从而在标注极度稀缺的文本属性图上大幅提升节点分类性能。
- GNN Explanations that do not Explain and How to find Them
-
本文揭示了自解释图神经网络(SE-GNN)的一个致命失败模式——模型可以在保持最优精度的同时输出与其真实推理过程毫无关系的"退化解释",并证明现有大多数忠实度指标识别不出这种解释;为此作者构造了一个可控基准,并提出新指标 EST 能可靠地把这类退化解释判为不忠实。
- GRAPHITE: Graph Homophily Booster — Reimagining the Role of Discrete Features in Heterophilic Graph Learning
-
提出 GRAPHITE,一种通过引入"特征节点"作为 hub 间接连接共享特征的节点来直接提升图同质性的非学习图变换方法,首次从"改变图结构"而非"改变 GNN 架构"的角度解决异质图问题,在 Actor 等困难基准上显著超越 27 种 SOTA 方法。
- Graph Random Features for Scalable Gaussian Processes
-
用基于随机游走的图随机特征(GRF)构造稀疏、无偏的图节点核估计,把图上高斯过程的贝叶斯推断从 \(\mathcal{O}(N^3)\) 降到 \(\mathcal{O}(N^{3/2})\),并带概率精度保证,从而在单卡上跑通了超过 100 万节点的图贝叶斯优化。
- Graph Representational Learning: When Does More Expressivity Hurt Generalization?
-
本文提出一族由图不变量参数化的伪度量 ζ-TMD,推导出依赖"训练-测试图结构相似度 + 模型复杂度 + 训练集规模"的数据相关泛化界,从理论上解释了"更高表达力的 GNN 何时反而泛化更差"——只有当增加的表达力与任务的结构-标签相关性对齐时才有益,否则只会徒增复杂度并恶化泛化。
- Graph Signal Processing Meets Mamba2: Adaptive Filter Bank via Delta Modulation
-
把 Mamba2 的多头递归重新解释成线图上的图滤波器组,用基于谱残差的 delta 调制把它分成"共享低通滤波器 + 专家高通滤波器"的层次结构 HADES,只用 58.9% 的参数就达到甚至超过 Mamba2 的性能。
- Graph Tokenization for Bridging Graphs and Transformers
-
提出 GraphTokenizer 框架,将图通过可逆的频率引导序列化转换为符号序列,再用 BPE 学习图子结构词汇表,使标准 Transformer(如 BERT/GTE)无需任何架构修改即可直接处理图数据,在 14 个 benchmark 上达到 SOTA。
- Graphon Cross-Validation: Assessing Models on Network Data
-
针对网络数据"边不独立"导致传统交叉验证失效的难题,本文提出 CV-imputation:把验证集的边当作缺失值用固定概率的 Bernoulli 随机填补来构造训练图,再用仿射变换还原概率矩阵,从而在保持图拓扑不被破坏的前提下,为 graphon 估计方法做超参数调优和模型选择,且理论上验证分数与真实估计误差渐近平行。
- GraphUniverse: Synthetic Graph Generation for Evaluating Inductive Generalization
-
提出 GraphUniverse 框架,通过分层生成具有持久语义社区的图族(graph families),首次实现对图学习模型归纳泛化能力的系统性评估,揭示了 transductive 性能无法可靠预测 inductive 泛化能力这一关键发现。
- HarmonyGNNs: Harmonizing Heterophily and Homophily in GNNs via Self-Supervised Node Encoding
-
HarmonyGNNs 用「师生预测式自监督(JEPA 风格)+ 节点难度驱动的动态掩码」做目标和谐,再用「线性/MLP 投影 + 加权 GCN + 特征级自注意力 + 层次融合」做表示和谐,让同一个无标签框架同时在同配图和异配图上都拿到 SOTA。
- HGNet: Scalable Foundation Model for Automated Knowledge Graph Generation from Scientific Literature
-
提出一个约 3 亿参数的两阶段框架:Z-NERD 用「正交语义分解 + 多尺度 TCQK 注意力」做域无关的多词实体识别,HGNet 用「父/子/同辈三通道消息传递 + 可微层级损失 + 连续抽象场损失」把关系抽取约束成一张逻辑自洽、几何有序的有向无环知识图谱,在 SciERC/SciER/SPHERE 上刷新 SOTA。
- HYPER: A Foundation Model for Inductive Link Prediction with Knowledge Hypergraphs
-
HYPER 是首个面向知识超图的链接预测基础模型,通过把"关系之间的位置交互"编码成可迁移的基础关系,让模型零样本泛化到含全新实体、全新关系、且元数(arity)任意的超图。
- Improving Long-Range Interactions in Graph Neural Simulators via Hamiltonian Dynamics
-
提出 Information-preserving Graph Neural Simulators (IGNS),利用 port-Hamiltonian 动力学结构在图上保持信息不耗散,结合 warmup 初始化、几何编码和多步训练目标,在 6 个物理仿真基准上全面超越现有图神经仿真器。
- Inductive Reasoning for Temporal Knowledge Graphs with Emerging Entities
-
针对时序知识图谱里「没有任何历史交互」的新增实体,TransFIR 用一个 BERT 文本嵌入 + 可学习 VQ 码本把实体归入语义簇,再把语义相似的已知实体的交互链模式迁移过去,从而避免表征坍缩,在四个基准上 MRR 平均提升 28.6%。
- Is Graph Unlearning Ready for Practice? A Benchmark on Efficiency, Utility, and Forgetting
-
本文构建了首个面向 GNN 遗忘(graph unlearning)的系统性基准,用"效率、效用、遗忘质量"三大维度横扫 10 类主流方法 × 7 个数据集,得出一个相当扫兴但务实的结论:在大规模图上,绝大多数遗忘方法既不比从头重训快、也没真正忘干净,重训目前仍是最靠谱的选择。
- Knowledge Reasoning Language Model: Unifying Knowledge and Language for Inductive Knowledge Graph Reasoning
-
KRLM 把知识图谱的结构表示与 LLM 的内在知识统一成一种"知识推理语言"(KRL),通过 KRL 分词器、带知识记忆的 KRL 注意力层和结构感知的下一实体预测器三件套,在归纳式 KGR 任务上抑制 LLM 被稀疏 KG 上下文带偏的"知识失真"和越界幻觉。
- Latent Geometry-Driven Network Automata for Complex Network Dismantling
-
本文提出 LGD-NA 框架,用只看局部拓扑的"网络元胞自动机规则"近似复杂网络的潜在几何距离,把节点的几何中心性当作拆解优先级,在 1475 个真实网络上超越所有现有拆解算法(除全局的 NBC 外),并可 GPU 加速、还能反过来用于加固网络鲁棒性。
- LEAP: Local ECT-Based Learnable Positional Encodings for Graphs
-
LEAP 把"局部欧拉示性变换"(ℓ-ECT)做成一个端到端可训练的局部结构位置编码:对每个节点的 m-hop 邻域算一张可微 ECT 矩阵,再用可学习投影压成低维向量插进 GNN,从而同时编码几何与拓扑信息,且复杂度与一步消息传递同阶。
- Learning Concept Bottleneck Models from Mechanistic Explanations
-
提出 Mechanistic CBM (M-CBM),利用 Sparse Autoencoder 从黑盒模型自身学到的特征中提取概念,再由多模态 LLM 命名和标注,构建可解释的 Concept Bottleneck Model,在控制信息泄露的条件下显著优于现有 CBM 方法。
- Learning from Historical Activations in Graph Neural Networks
-
提出 HISTOGRAPH——一个两阶段注意力 readout 层,把 GNN 各层(而非仅最后一层)的"历史激活"当成一条轨迹序列来池化,先做层间注意力再做节点间注意力,在深层 GNN 上显著缓解过平滑并提升图分类性能。
- Learning Posterior Predictive Distributions for Node Classification from Synthetic Graph Priors
-
把表格领域的 Prior-Fitted Network(PFN)范式搬到图上,只在数千张由可控先验生成的合成图上预训练一个模型 NodePFN,就能对任意真实图做免训练、单次前向的通用节点分类,在 23 个 benchmark 上拿到 71.27% 平均准确率。
- Learning with Dual-level Noisy Correspondence for Multi-modal Entity Alignment
-
针对多模态知识图谱实体对齐中普遍存在的"双层噪声对应"(实体-属性层 + 跨图层),本文提出 RULE 框架:用"不确定性 + 共识"两条准则估计每个对应关系的可靠度,据此在属性融合和跨图对齐时抑制噪声,并在测试时用 MLLM 推理挖掘隐含的属性关联,在五个基准上平均 H@1 比第二名高出 5 个点以上。
- LogicXGNN: Grounded Logical Rules for Explaining Graph Neural Networks
-
LogicXGNN 提出了一种从已训练的图神经网络中提取可解释一阶逻辑规则的 post-hoc 框架:通过图结构哈希和隐藏层嵌入模式识别谓词、用决策树确定判别式 DNF 规则结构、并将抽象谓词接地到输入空间,最终生成可替代原始 GNN 的规则化分类器,同时可作为可控的图生成模型。
- Low-Rank Few-Shot Node Classification by Node-Level Graph Diffusion
-
用一个节点级图扩散模型 FGDM 合成"以假乱真"的支持集节点与它们的连边来扩充 few-shot 任务,再配上一个由低频特性(LFP)启发、有泛化界保证的低秩转导分类器来抵抗扩散噪声,把少样本节点分类做到了 SOTA。
- LRIM: a Physics-Based Benchmark for Provably Evaluating Long-Range Capabilities in Graph Learning
-
用统计物理里被研究透了的长程 Ising 模型造出一个可证明、可控的图学习长程基准(10 个数据集、256→65k 节点),任务是预测每个自旋翻转的能量变化 ∆E,其真值在数学上必然依赖远距离节点,从而第一次让"长程建模有提升"的论断有了靠得住的衡量标尺。
- MobileKGQA: On-Device KGQA System on Dynamic Mobile Environments
-
MobileKGQA 把高维 LLM embedding 压成二进制哈希码喂给 GNN 推理模块,再配一套逐步推理的标注自动生成方法,让知识图谱问答系统第一次能在手机/边缘设备上直接训练并适应不断累积的用户数据,在 Jetson Orin Nano 上以 30.4% 的能耗换来 20.3% 的性能提升。
- Multi-Domain Riemannian Graph Gluing for Building Graph Foundation Models
-
本文用微分几何的"流形粘接"视角重构多域图预训练:把任意图数据集融合进一个统一、光滑的黎曼流形上,从而第一次给"知识如何跨域整合与迁移"提供了严格的理论刻画,并据此提出可量化迁移难度、带几何缩放律的 GRAPHGLUE 框架。
- Multi-Scale Diffusion-Guided Graph Learning with Power-Smoothing Random Walk Contrast for Multi-View Clustering
-
提出 MANGO 框架,用「熵引导的多尺度图扩散」动态融合不同步长的相似度矩阵以兼顾局部与全局结构,再用「随机游走 + β 幂平滑」纠正对比学习中的假负样本,并通过共享结构嵌入的视图一致性模块缓和一致性与特异性的矛盾,在 12 个数据集上刷新多视图聚类 SOTA。
- Neural Graduated Assignment for Maximum Common Edge Subgraphs
-
把 NP 完全的最大公共边子图(MCES)问题改写成关联公共图上的二次分配问题,再用一个温度参数完全可学习的"神经化渐进分配"网络在多项式时间里无监督地逼近最优解,速度与精度同时碾压传统搜索求解器。
- On The Expressive Power of GNN Derivatives
-
本文发现把一个基础 MPNN 对输入节点特征的高阶导数当作额外结构特征喂给下游 GNN,能严格提升表达力,由此提出 HOD-GNN,理论上对齐 WL 层级、与子图 GNN 和随机游走结构编码深度等价,并配套一个利用图稀疏性的可微分消息传递式导数计算算法,在七八个图基准上稳定进前二档且能扩展到子图 GNN 跑不动的大图。
- On the Expressive Power of GNNs for Boolean Satisfiability
-
从 Weisfeiler-Leman (WL) 测试角度严格证明了完整的 WL 层级无法区分可满足与不可满足的 3-SAT 实例,揭示了 GNN 用于 SAT 求解的理论表达力极限,同时识别出平面 SAT 和随机 SAT 等 GNN 可成功区分的正面实例族。
- On the Trade-off Between Expressivity and Privacy in Graph Representation Learning
-
本文首次在理论上刻画「图表示的表达力」与「边级差分隐私」之间的根本张力,提出用带噪同态密度向量作为图嵌入:它在期望意义下保持完整的判别能力,同时按每个密度的平滑敏感度注入校准噪声以满足形式化的差分隐私保证,并证明越强表达力的模式类需要越多噪声这一显式权衡。
- On the Universality and Complexity of GNN for Solving Second-order Cone Programs
-
本文为二阶锥规划(SOCP)设计了一种把非线性锥约束拆解成四类节点的图表示与配套的三子层消息传递 GNN,证明了它对 SOCP 可行性与最优解的通用逼近能力,并首次给出 WL 类 L2O-GNN 基于 Rademacher 复杂度的样本复杂度界;实验中以远少于全连接网络的参数(500 维问题上 0.35Mb vs 110Mb,约 300× 压缩)取得更高预测精度。
- One for Two: A Unified Framework for Imbalanced Graph Classification via Dynamic Balanced Prototype
-
UniImb 用一套"动态平衡原型 + 负载均衡正则"的统一框架,同时解决图分类里的类别不平衡(少数类样本太少)和拓扑不平衡(小图被大图淹没)两类问题,在 19 个数据集、对比 23 个基线上取得全面领先。
- Out-of-Distribution Graph Models Merging
-
本文提出 OGMM,研究"分布外图模型融合"这一新问题:在拿不到任何源/目标域数据、且各 GNN 架构可能异构的前提下,先让每个预训练 GNN 反演生成一小批带标签的合成图,再用带掩码专家的稀疏 MoE 把这些模型微调融合成一个能在未见分布上泛化的统一模型。
- Pairwise is Not Enough: Hypergraph Neural Networks for Multi-Agent Pathfinding
-
提出 HMAGAT,用有向超图注意力网络替代 GNN 的成对消息传递来建模多智能体路径规划中的群体交互,仅用 1M 参数和 1% 训练数据即超越 85M 参数的 SOTA 模型。
- PRISM: Partial-label Relational Inference with Spatial and Spectral Cues
-
PRISM 针对「每张图只给了一个含真值的候选标签集」的偏标记图学习问题,用原型引导的子结构对齐抽空间线索、用多频带谱注意力抽频谱线索,把两类线索拼成一张混合关系图做候选约束下的迭代标签传播,从而在多种噪声水平下都显著超过现有弱监督图分类方法。
- RAS: Retrieval-And-Structuring for Knowledge-Intensive LLM Generation
-
提出 RAS 框架,在推理时为每个问题动态构建查询特定的知识图谱,通过迭代检索规划、文本到三元组转换和图增强回答三个阶段实现结构化推理,在 7 个知识密集型基准上对开源和闭源 LLM 分别取得最高 7.0% 和 8.7% 的提升。
- ReLaSH: Reconstructing Joint Latent Spaces for Efficient Generation of Synthetic Hypergraphs with Hyperlink Attributes
-
ReLaSH 把"带属性的超图"生成拆成两步——先用一个可解释的似然嵌入模型把超边和它们的属性压进一个低维联合潜空间,再用一个分布无关的得分扩散生成器在这个低维空间里重建数据分布,从而既绕开高维离散结构的维度灾难、又在医疗病历/论文合著/菜谱三类真实数据上全面超过 VAE/GAN/扩散等通用基线。
- Relational Graph Transformer
-
提出 RelGT,首个专为关系型数据库设计的图 Transformer,通过多元素 Token 化(特征/类型/跳距/时间/局部结构 5 元组)和局部-全局混合注意力机制,在 RelBench 基准的 21 个任务上一致超越 GNN 基线,最高提升 18%。
- Relatron: Automating Relational Machine Learning over Relational Databases
-
系统比较关系深度学习(RDL/GNN)和深度特征合成(DFS)在关系数据库预测任务上的性能,发现两者各有优势且高度任务依赖,提出 Relatron——基于任务嵌入的元选择器,通过 RDB 任务同质性和亲和力嵌入实现自动架构选择,在联合架构-超参搜索中提升达 18.5%。
- Rethinking the Gold Standard: Why Discrete Curvature Fails to Fully Capture Over-squashing in GNNs?
-
这篇论文系统反驳了"高负曲率 = 过度挤压"这个图学习领域的金标准:通过构造反例图族证明高负曲率只是过度挤压的充分非必要条件,提出 MOSR 指标量化曲率漏检了 30%~40% 的挤压边,并给出新的加权曲率 WAF3 及其线性时间 MinHash 近似算法(500 万边图上 23.6 秒,比现有最快曲率快 133.7 倍)。
- Revisiting Node Affinity Prediction in Temporal Graphs
-
本文指出现有时序图神经网络(TGNN)在"节点亲和度预测"上居然打不过 Moving Average 这种朴素启发式,根因是它们既表达不出移动平均、又用了不适配排序的交叉熵损失;据此提出 NAVIS——一个把启发式当作线性状态空间模型特例来推广的可学习线性 SSM,配上排序损失,在 TGB 上全面超过启发式与所有 TGNN。
- Robustness in Text-Attributed Graph Learning: Insights, Trade-offs, and New Defenses
-
这篇论文首次把经典 GNN、鲁棒 GNN(RGNN)和 GraphLLM 放到统一的文本属性图(TAG)对抗鲁棒性评测框架里横向比较,揭示了"模型只能防住文本攻击或结构攻击之一、防不住两者"的文本-结构权衡,并提出 SFT-auto——一个用 LLM 推理能力把"攻击检测 + 恢复 + 预测"统一进单一模型的防御框架,在两类攻击下都拿到均衡且领先的鲁棒性。
- SAGA: Structural Aggregation Guided Alignment with Dynamic View and Neighborhood Order Selection for Multiview Graph Domain Adaptation
-
SAGA 面向多关系图上的无监督图领域自适应,提出 Structural Aggregation Distance 在训练中动态选择最可迁移的视图与邻域阶数组合,并用该组合引导跨视图、跨域对齐,在 ACM 与 MAG 多视图图节点分类迁移任务上显著优于现有 GDA 方法。
- Scaling Knowledge Graph Construction through Synthetic Data Generation and Distillation
-
针对文档级知识图谱构建中"大模型贵、小模型差"的两难,本文用一条多步合成管线 SynthKG(分块→去上下文化→实体/命题/三元组抽取)造出 10 万对高质量文档-KG 训练数据,再把这套多步流程蒸馏进一个 8B 小模型 Distill-SynthKG,使其单步推理就能产出媲美 8 倍大模型的 KG,并在检索与多跳问答上全面超过 GraphRAG / HippoRAG。
- Self-Consistency Improves the Trustworthiness of Self-Interpretable GNNs
-
自解释 GNN(SI-GNN)训练时优化的是交叉熵+简洁正则,评测时却用忠实度(faithfulness),两者错位;本文指出忠实度本质上等价于"解释自洽性",于是加一个把第一遍解释回灌后再生成的第二遍解释对齐起来的自洽(SC)损失,做一次模型无关的微调,就能在一致性、准确度、忠实度、信息量四个维度上同时提升解释质量。
- Sheaves Reloaded: A Directional Awakening
-
本文提出有向胞腔层(Directed Cellular Sheaf),用复值、方向感知的限制映射把边的方向编码进相位,进而构造 Hermitian 的有向层拉普拉斯 \(L_{\tilde F}\),得到第一个把方向归纳偏置嵌入架构的 Sheaf 神经网络 DSNN,在 12 个节点分类基准上 10 个取得最优。
- Si-GT: Fast Interconnect Signal Integrity Analysis for Integrated Circuit Design via Graph Transformers
-
Si-GT 把芯片互连建模成耦合 RC 电路图,用一个为串扰效应定制的图 Transformer(mesh 结构编码 + 虚拟 NET token + 内/外网注意力偏置)直接预测串扰延迟和毛刺,精度超过现有 GNN / 图 Transformer,且推理只要 4ms,比 SPICE 仿真快两个数量级。
\(_k\)>: One LLM Token for Explicit Graph Structural Understanding -
本文把整张图或目标节点的拓扑压缩成一个与 LLM 原生词表共存的离散结构 token
<SOG$_k$>,再用结构问答把它和文本 token 对齐,从而在分子图分类和节点分类上用极少 token 显著提升 LLM 的图结构理解能力。 - Structurally Human, Semantically Biased: Detecting LLM-Generated References with Embeddings and GNNs
-
通过构建 10000 篇论文的配对引用图(人类 vs GPT-4o 生成 vs 随机基线),发现 LLM 生成的参考文献在图拓扑结构上与人类几乎不可区分(RF 仅 60% 准确率),但语义嵌入可有效检测(RF 83%,GNN 93%),说明 LLM 精确模仿了引用拓扑但留下了可检测的语义指纹。
- Structure-Aware Graph Hypernetworks for Neural Program Synthesis
-
把"程序合成"重铸为在固定网络架构的权重空间里做连续优化,并提出一个结构感知的图超网络 Meta-GNN——它把目标网络画成"权重=边、偏置=点"的神经图、在置换等价组内绑定编码/消息/解码参数,从而折叠掉神经元置换带来的冗余监督,使得从用户意图一次前向直接生成整套权重、并显著提升对未见意图的 OOD 泛化。
- Temporal Graph Thumbnail: Robust Representation Learning with Global Evolutionary Skeleton
-
TGT 把整段时序图蒸馏成一张静态"缩略图"(global evolutionary skeleton),用冯·诺依曼图熵刻画结构演化、用 Donsker-Varadhan 互信息估计刻画特征演化,再以这张缩略图作为信息瓶颈约束来引导表示学习;在 Bitcoin / MathOverflow / MOOC 三个数据集上,干净与多种噪声扰动下的链接预测都显著超过 SOTA,尤其在快速演化和重噪声场景。
- TGM: A Modular and Efficient Library for Machine Learning on Temporal Graphs
-
TGM 是首个把连续时间动态图(CTDG)和离散时间动态图(DTDG)统一在同一套数据抽象下的时序图学习研究框架,用「事件流 + 时间粒度迭代」统一两种范式、用可组合的 Hook 机制标准化数据变换,端到端训练比常用库 DyGLib 平均快 7.8×、图离散化平均快 175×。
- TopoFormer: Topology Meets Attention for Graph Learning
-
TopoFormer 把图按节点或边滤波函数切成一串局部拓扑切片,用每个切片的 Betti 数和规模统计组成短 token 序列,再交给 Transformer 学图级表示,在图分类和分子性质预测上以较低计算成本达到接近或超过强基线的效果。
- Topological Anomaly Quantification for Semi-Supervised Graph Anomaly Detection
-
针对"只有正常节点标签"的半监督图异常检测,TAQ-GAD 用两个纯拓扑指标(边界分 NBS + 隔离分 PIS)量化每个标注正常节点的"异常程度",从中筛出高质量伪异常节点,再用拓扑增强模块(TAE)生成虚拟异常中心并重连图结构,最终在增强图上联合训练,在 6 个数据集上稳定超过 GGAD 等 SOTA。
- Topological Flow Matching
-
把流匹配重新诠释为"零噪声极限下的退化薛定谔桥",再给其参考过程加一项由 Hodge 拉普拉斯导出的热扩散漂移,就得到 topological flow matching(TFM)——一个保留仿真无关训练目标与确定性采样路径、可即插即用替换标准流匹配的拓扑感知生成框架,在脑 fMRI、洋流、地震、交通等结构化信号上大幅超过流匹配与拓扑薛定谔桥。
- Topology Matters in RTL Circuit Representation Learning
-
针对现有 RTL 电路表示学习把 Verilog 当普通代码、忽略硬件拓扑的问题,TopoRTL 把电路拆成寄存器锥、构建「图 + 文本摘要」双模态,再用三种拓扑感知位置编码注入注意力、配合拓扑引导的跨模态对齐,用仅 29M 参数在 PPA 预测和电路检索上超过 7B 级文本大模型。
- Towards a Foundation Model for Crowdsourced Label Aggregation
-
CrowdFM 把"从众包噪声标签里推真值"这件事从"每个数据集单独估参数"升级成"一个预训练好的二部图神经网络零样本通吃":用领域随机化的合成众包数据预训练一个显式建模 worker / task / option 的注意力 GNN,在 22 个真实数据集上无需任何重训就能匹配甚至超过逐数据集定制的方法,且推理只要 0.53 秒/数据集。
- Towards Improved Sentence Representations using Token Graphs
-
提出 Glot,一种轻量结构感知池化模块,将冻结 LLM 的 token 级隐状态构建为潜在相似性图,通过 GNN 细化后聚合为句子表征,在 GLUE/MTEB 上与微调方法竞争力相当但仅需 20× 更少参数和 100× 更快训练。
- Towards Quantifying Long-Range Interactions in Graph Machine Learning: A Large Graph Dataset and a Measurement
-
本文用四座真实城市的道路网络构建了一个百万级节点、直径上百的大图转导式数据集 City-Networks,并用「局部偏心率」标注出天然需要远距离信息的节点分类任务;在此基础上提出一个基于 Jacobian 的「逐跳影响力」度量,可以直接量化任意 GNN/GT 究竟用到了多远的邻居信息,从而把过去靠「全局注意力 vs 局部聚合」性能差来间接论证长程依赖的做法,换成可测、可比、有理论支撑的方案。
- Training-Free Counterfactual Explanation for Temporal Graph Model Inference
-
TemGX 是一个免训练、模型无关、可查询的时序图神经网络(TGNN)解释框架——它把"哪段历史子图导致了 TGNN 的当前预测"形式化成滑动窗口下的反事实分析,用一套融合"级联影响力 + 时间有效电阻 + 时间衰减"的可解释性打分挑出真正影响决策的节点,并以贪心"选择-验证"算法在保证 \((1-1/e)\) 近似的前提下高效生成解释,在 fidelity 和速度上都明显超过现有 TGNN 解释器。
- UrbanGraph: Physics-Informed Spatio-Temporal Dynamic Heterogeneous Graphs for Urban Microclimate Prediction
-
UrbanGraph 把太阳遮挡、植被蒸散、对流扩散这些已知物理规律直接编码进图的拓扑结构——每小时按物理方程重建一张稀疏的动态异质图,再用 RGCN+LSTM 解耦空间与时序,在城市微气候预测上达到 SOTA(R²=0.8542),同时相比隐式动态图基线 LRGCN 把 FLOPs 砍掉 73.8%、训练加速 21%。
- WATS: Wavelet-Aware Temperature Scaling for Reliable Graph Neural Networks
-
WATS 是一个针对节点分类的后处理(post-hoc)校准框架,用可调尺度的热核图小波特征为每个节点预测一个专属温度去缩放 logits,从而在不重训模型、不依赖邻居 logits 的前提下让 GNN 的置信度对齐真实准确率,在 9 个数据集上把 ECE 最多降低 41.2%。