AAAI2026 其他论文解读论文笔记 Agent 对抗鲁棒扩散模型布局/合成对齐/RLHF 推理

📂 其他¶

🤖 AAAI2026 · 117 篇论文解读

📌 同领域跨会议浏览： 📷 CVPR2026 (105) · 🔬 ICLR2026 (115) · 💬 ACL2026 (3) · 🧪 ICML2026 (70) · 🧠 NeurIPS2025 (121) · 📹 ICCV2025 (33)

🔥 高频主题： Agent ×9 · 对抗鲁棒 ×5 · 扩散模型 ×4 · 布局/合成 ×2 · 对齐/RLHF ×2

A Fast Heuristic Search Approach for Energy-Optimal Profile Routing for Electric Vehicles: 提出基于多目标A搜索的label-setting方法（Pr-A），在初始电量未知时高效求解电动车能耗最优路径（profile搜索），通过profile支配关系剪枝避免传统方法中复杂的profile合并操作，在大规模路网上性能接近已知初始电量的标准A*搜索。
A New Strategy for Verifying Reach-Avoid Specifications in Neural Feedback Systems: 提出FaBRe（Forward and Backward Reachability）策略，首次开发了针对ReLU神经网络控制器的后向可达集过近似和欠近似算法（GSS/ICH/LEB），并将其与前向可达性分析结合，构成统一的reach-avoid验证框架，旨在突破纯前向分析的可扩展性瓶颈。
A Phase Transition for Opinion Dynamics with Competing Biases: 在有向随机图上建模两种对立力量（外部颠覆性偏差 vs 个体顽固性）对二元观点传播的影响，证明系统存在尖锐相变：偏差超过临界阈值 \(p_c\) 时群体快速达成新共识，低于阈值则长期处于亚稳极化状态，且临界点仅由度序列的两个简单统计量决定。
A Topological Rewriting of Tarski's Mereogeometry: 在 Coq 定理证明器中扩展 λ-MM 库，将基于 Leśniewski 部分学（mereology）的 Tarski 固体几何重写为具备完整拓扑结构的形式化系统，证明部分学类对应正则开集、满足 Kuratowski 内部公理且具有 Hausdorff（T2）性质，从而为定性空间推理提供了统一的部分学-几何-拓扑理论框架。
Align When They Want, Complement When They Need! Human-Centered Ensembles for Adaptive Human-AI Collaboration: 揭示了人机协作中"互补性"（complementarity）与"对齐性"（alignment）之间存在根本性权衡——单一模型无法同时优化二者，提出自适应AI集成框架，通过Rational Routing Shortcut（RRS）机制在对齐模型和互补模型之间动态切换，团队准确率较标准AI提升最高9%。
An Epistemic Perspective on Agent Awareness: 本文首次将 agent awareness（智能体感知/意识）视为一种知识形式，区分了 de re（关于物理对象的）和 de dicto（关于概念/描述的）两种感知模态，并基于 2D 语义学提出了一个可靠且完备的逻辑系统来刻画这两种模态与标准"事实知识"模态之间的相互作用。
Approximation Algorithm for Constrained k-Center Clustering: A Local Search Approach: 研究带 cannot-link (CL) 和 must-link (ML) 实例级约束的 k-center 聚类问题，提出基于支配匹配集（dominating matching set, DMS）转化的局部搜索框架，在不相交 CL 集条件下首次通过局部搜索达到最优近似比 2，解决了该领域一个开放问题。
Area-Optimal Control Strategies for Heterogeneous Multi-Agent Pursuit: 研究异构速度下多追逐者-单逃避者的追逃博弈——定义逃避者安全可达集为所有追逐者-逃避者对的 Apollonius 圆的交集，将捕获策略建模为追逐者最小化/逃避者最大化该交集面积的零和博弈，推导出闭式瞬时最优航向控制律，仿真验证追逐者可系统性缩小安全区域实现保证捕获。
Automated Reproducibility Has a Problem Statement Problem: 提出基于科学方法的可复现性形式化问题定义，将经验性AI研究表示为假设-实验-解释的图结构，并用LLM自动从20篇论文中提取该结构，经原作者评审验证其有效性。
Autonomous Concept Drift Threshold Determination: 证明了固定阈值不可能在所有场景下最优、动态阈值严格优于静态阈值，并提出DTD算法：在漂移检测信号触发后启动三模型比较阶段，根据候选模型表现自适应调整检测阈值。
Axis-Aligned Document Dewarping: 提出利用平面文档固有的"轴对齐"几何性质，在训练、推理和评估三个阶段系统性地引入轴对齐约束，实现了SOTA文档矫正效果并提出新评估指标AAD。
Bandit Learning in Housing Markets: 本文首次将多臂老虎机（MAB）框架引入住房市场（单边匹配市场），定义了基于核（core）概念的遗憾值，并分别提出去中心化 ETC 和中心化 UCB 两种算法，证明了 \(\mathcal{O}(N\log T / \Delta_{\min}^2)\) 的去中心化遗憾上界与匹配的下界，建立了阶最优性。
Bayesian Network Structural Consensus via Greedy Min-Cut Analysis: 提出 MCBNC 算法，基于最小割（min-cut）分析量化边的结构支持度，并将其嵌入贪心等价搜索（GES）的后向阶段来迭代剪枝融合贝叶斯网络中的冗余边，在不访问数据的情况下生成更稀疏、更精确的共识结构，适用于联邦学习场景。
Beyond World Models: Rethinking Understanding in AI Models: 本文通过三个来自科学哲学的案例研究（多米诺计算机、数学证明、玻尔原子理论），论证世界模型（world models）框架不足以刻画人类级别的"理解"，指出仅靠追踪状态和状态转换无法捕获理解所需的抽象推理、动机洞察和问题情境把握能力。
Bilevel MCTS for Amortized O(1) Node Selection in Classical Planning: 提出双层MCTS（Bilevel MCTS），在MCTS选中的叶节点处运行深度比例预算的最优优先搜索，将节点选择均摊复杂度从 \(O(\log N)\) 降至 \(O(1)\)，辅以树崩塌（Tree Collapsing）减少动作选择步数，最终整合为 Nεbula 规划器，在IPC2018/2023基准上以192.2/230.6解题数（5min/30min）超越LAMA、DecStar、NOLAN、SM-Type-LAMA等全部SOTA。
Bipartite Mode Matching for Vision Training Set Search from a Hierarchical Data Server: 提出层级数据服务器 + 二部图模式匹配（BMM）框架，通过多粒度层级聚类组织大规模源数据、用匈牙利算法一对一匹配源域和目标域的语义模式（modes），从而搜索出与目标域分布差距最小的训练集，在行人重识别和目标检测任务上显著优于已有训练集搜索方法。
Boosting Adversarial Transferability via Ensemble Non-Attention: 提出 NAMEA（Non-Attention Meta Ensemble Attack），首次利用集成模型的非注意力区域（non-attention areas）融合 CNN 和 ViT 的可迁移信息，结合元学习梯度优化，在跨架构对抗迁移性上平均超越 SOTA 方法 AdaEA 和 SMER 分别 15.0% 和 9.6%。
Break the Tie: Learning Cluster-Customized Category Relationships for Categorical Data Clustering: 提出 DISC 方法，为每个聚类簇学习定制化的属性类别关系（而非全局统一距离），通过关系树建模与聚类联合优化，在 12 个数据集上以平均排名 1.25 大幅超越现有最佳方法（5.21）。
Bridging the Skills Gap: A Course Model for Modern Generative AI Education: 本文提出了一个面向本科和研究生计算机科学学生的生成式 AI 应用课程模型，通过混合方法调查表明该课程在弥合产业界与学术界之间的生成式 AI 技能差距方面效果显著，学生普遍认为课程有价值且有效。
Cash Flow Underwriting with Bank Transaction Data: Advancing MSME Financial Inclusion in Malaysia: 提出基于银行流水数据的端到端现金流承保工作流，构建首个马来西亚 MSME（中小微企业）银行账单数据集（611 条贷款记录），验证银行交易衍生特征相比传统申请信息可将逻辑回归模型的 AUROC 从 0.672 提升至 0.850，显著增强对缺乏信用记录的中小微企业的信用评估能力。
Center-Outward q-Dominance: A Sample-Computable Proxy for Strong Stochastic Dominance in Multi-Objective Optimisation: 基于最优传输理论中的中心向外分布函数，提出 q-dominance 关系作为强一阶随机支配（strong FSD）的可计算近似，证明全分位数范围的 q-dominance 可推导出强 FSD，并给出显式样本量阈值控制 Type I 错误，在超参数调优排名和噪声多目标优化中验证了其实用性。
Certified Branch-and-Bound MaxSAT Solving (Extended Version): 为 Branch-and-Bound MaxSAT 求解器实现了基于 VeriPB 证明系统的认证，覆盖了 look-ahead 边界方法和多值决策图（MDD）编码两大核心技术，在 MaxCDCL 求解器上的实验表明证明日志的中位开销仅 19%，填补了 MaxSAT 求解范式认证的最后空白。
Certified but Fooled! Breaking Certified Defences with Ghost Certificates: 提出 GhostCert，一种基于显著性区域的对抗攻击方法，能在保持扰动不可感知的同时误导分类器并伪造大半径的认证证书（ghost certificates），在 ImageNet 上对包括 DensePure 在内的 SOTA 认证防御取得显著优于 Shadow Attack 的攻击成功率和更大的伪造认证半径。
Clinician-in-the-Loop Smart Home System to Detect Urinary Tract Infection Flare-Ups via Uncertainty-Aware Decision Support: 提出一种临床医师参与闭环的智能家居系统，利用环境传感器数据提取行为标记，结合新颖的共形校准区间（CCI）方法量化预测不确定性，实现对老年人尿路感染（UTI）发作的可靠检测与"不确定时弃权"的决策支持。
Controllable Financial Market Generation with Diffusion Guided Meta Agent: 提出Diffusion Guided Meta Agent（DigMA）模型，将可控金融市场生成形式化为条件生成任务，用条件扩散模型捕捉市场状态动态（中间价收益率与订单到达率的时变分布参数），结合具有金融经济学先验的Meta Agent生成订单流，在可控性和生成保真度上均超越现有方法。
Cost-Free Neutrality for the River Method: 针对River投票方法的并行宇宙打破平局（PUT）问题，证明其获胜者集合可在多项式时间内计算（相比Ranked Pairs的NP-完全性），提出Fused-Universe（FUN）算法，一次遍历同时模拟所有可能的打破平局方式，并为每个获胜者提供构造性证书。
Data Complexity of Querying Description Logic Knowledge Bases under Cost-Based Semantics: 系统研究加权描述逻辑知识库在代价语义下的查询应答的数据复杂度，证明最优代价语义在\(\Delta_2^p\)内可解，并给出一个令人惊喜的正面结果：在DL-Lite\(_{\text{bool}}^{\mathcal{H}}\)本体和固定代价界限下，实例查询的确定回答和合取查询的可能回答可通过一阶重写实现最低数据复杂度（AC\(^0\)）。
DcMatch: Unsupervised Multi-Shape Matching with Dual-Level Consistency: 提出DcMatch——一种无监督多形状匹配框架，通过形状图注意力网络捕捉形状集合底层流形结构以构建更具表达力的共享宇宙空间，并在空间域和谱域实施双层循环一致性约束，在多个基准数据集上实现全面超越。
Deadline-Aware, Energy-Efficient Control of Domestic Immersion Hot Water Heaters: 提出一种基于截止时间感知的家用热水器节能控制方法，通过 Gymnasium 仿真环境比较 bang-bang 基线、MCTS 规划器和 PPO 策略，证明 PPO 在相同物理条件下能节省高达 69% 的能量。
Decomposition and Preprocessing of Ternary Constraint Networks: 提出将任意离散约束网络形式化分解为三元约束网络(TCN)的完整理论框架，并通过七项预处理技术（传播、代数简化、公共子表达式消除等）将分解引入的变量/约束膨胀从中位数8x/6x降至4.8x/4.3x，为GPU硬件上的高效约束求解提供规则化数据布局。
DECOR: Deep Embedding Clustering with Orientation Robustness: 提出 DECOR 框架，通过旋转不变的等变卷积自编码器（RCAE）+ 非参数聚类（DeepDPM）+ 集成异常检测，实现晶圆图缺陷模式的方向鲁棒聚类。
Deep Incomplete Multi-View Clustering via Hierarchical Imputation and Alignment: 提出 DIMVC-HIA，一个集成层次化填充与双重对齐的深度不完整多视图聚类框架，先填充缺失聚类分配再填充缺失特征，在高缺失率（70%）下仍保持稳健性能。
DeepRWCap: Neural-Guided Random-Walk Capacitance Solver for IC Design: 提出 DeepRWCap，一种机器学习引导的随机游走电容求解器，通过两阶段神经网络架构预测转移核来加速IC设计中的多介质域电容提取，在10个工业测试案例上实现平均1.24%误差和23%加速。
Description Logics with Two Types of Definite Descriptions: Complexity, Expressiveness, and Automated Deduction: 引入描述逻辑 ALC 的两种定冠描述扩展——局部定冠描述 \(\{ι C\}\) 和全局定冠描述 \(ι C.D\)，证明三个扩展逻辑的可满足性问题均为 ExpTime-complete，但全局定冠描述严格比局部更具表达力（\(\mathcal{ALC}\iota_L < \mathcal{ALC}\iota_G = \mathcal{ALC}\iota\)），并给出表列演算决策过程及实验评估。
Designing Incident Reporting Systems for Harms from General-Purpose AI: 通过文献综述和九个安全关键行业（核能、航空、医疗等）的案例研究，提出了 AI 事件报告系统制度设计的七维框架，为美国通用 AI 事件报告的政策设计提供系统性指导。
DeToNATION: Decoupled Torch Network-Aware Training on Interlinked Online Nodes: 提出 FlexDeMo——一种将全分片数据并行（FSDP）与解耦动量优化相结合的混合分片训练策略，在节点内使用 FSDP 分片、节点间仅同步快速移动的动量分量，实现了接近全同步 AdamW 的损失收敛同时显著加速训练。
Deviation Dynamics in Cardinal Hedonic Games: 本文在基数享乐博弈（cardinal hedonic games）的动态模型中提出元定理，证明偏离动态可能收敛或必然收敛的判定复杂度可以直接从不存在稳定结果的实例推导得出，并在加性可分享乐博弈中提出利用偏离动态寻找个体理性和合同个体稳定分区的方法。
DFDT: Dynamic Fast Decision Tree for IoT Data Stream Mining on Edge Devices: 提出 DFDT（Dynamic Fast Decision Tree），一种面向 IoT 边缘设备的内存受限数据流挖掘算法，通过活动感知预剪枝、动态 grace period、自适应 tie threshold 三重机制有机调控树的增长，实现精度-内存-运行时间的最优权衡。
DiffMM: Efficient Method for Accurate Noisy and Sparse Trajectory Map Matching via One Step Diffusion: 提出 DiffMM，首次将扩散模型引入地图匹配任务，通过路段感知轨迹编码器和一步 Shortcut 扩散过程，在稀疏轨迹和复杂路网上实现了精度和效率的双重提升，推理速度比次优方法快约 17 倍。
DS-ATGO: Dual-Stage Synergistic Learning via Forward Adaptive Threshold and Backward Gradient Optimization for Spiking Neural Networks: 针对SNN训练中因膜电位分布偏移导致的脉冲发放不均衡和梯度消失问题，提出前向自适应阈值+后向阈值驱动梯度优化的双阶段协同学习算法DS-ATGO，在CIFAR10/100和ImageNet上以低时延实现SOTA性能。
Enhancing Control Policy Smoothness by Aligning Actions with Predictions from Preceding States: 提出 ASAP（Action Smoothing by Aligning Actions with Predictions from Preceding States），一种基于转移诱导相似状态定义的强化学习动作平滑方法，通过空间约束（对齐前一状态的预测动作）和时间约束（惩罚二阶动作差异）有效抑制高频动作振荡，在 Gymnasium 和 Isaac-Lab 环境中优于现有方法。
Enhancing Noise Resilience in Face Clustering via Sparse Differential Transformer: 提出预测驱动的 Top-K Jaccard 相似度系数提升邻居纯度，配合稀疏差分 Transformer（SDT）消除噪声注意力，在 MS-Celeb-1M 等大规模人脸聚类数据集上达到 SOTA 性能。
EvoEmpirBench: Dynamic Spatial Reasoning with Agent-ExpVer: 提出 EvoEmpirBench（EEB），包含两个动态交互式 benchmark（局部可观测迷宫导航 + 消消乐），以及 Agent-ExpVer 三智能体在线学习框架（GeoLink 交互 + InsightForce 经验抽象 + TruthWeaver 知识管理），通过"经验→验证→真理归纳"的认知循环实现无参数更新的持续策略进化，使 GPT-4.1 成功率提升 5.6%、Qwen-32B 提升 29%。
Expressive Temporal Specifications for Reward Monitoring: 利用量化线性时序逻辑（LTLf[F]）自动合成量化奖励监控器（QRM），为强化学习智能体在运行时生成密集的连续值奖励流，从根本上缓解布尔语义下长时任务的稀疏奖励问题。
Extreme Value Monte Carlo Tree Search for Classical Planning: 利用 Peaks-Over-Threshold 极值理论（POT EVT）为经典规划中 MCTS 的 Full Bellman Backup 提供统计理论基础，提出 UCB1-Uniform bandit 算法，用均匀分布（Generalized Pareto 的特例）的 MLE 估计指导动作选择，在 Pyperplan 上以 \(10^4\) 节点预算超越 GBFS 67.8 个实例、超越 Softmin-Type(h) 33.2 个实例。
Faster Certified Symmetry Breaking Using Orders With Auxiliary Variables: 通过引入辅助变量编码字典序来替代大整数编码，对 VeriPB 证明系统进行本质重设计，使 SAT 对称性破坏的证明生成和验证在理论和实践上均获得数量级加速。
Finding Diverse Solutions Parameterized by Cliquewidth: 将"寻找多样化解"的参数化框架从treewidth扩展到更强的cliquewidth图参数，证明任何基于cliquewidth分解的单调动态规划都可以以极小额外开销转换为求解多样化版本的算法，并提出了一族新的Venn多样性度量函数。
Forest vs Tree: The (N, K) Trade-off in Reproducible ML Evaluation: 本文研究机器学习评估中样本数量 \(N\) 和每个样本标注者数量 \(K\) 之间的最优权衡：在固定预算 \(N \times K\) 下，通过分析多类别标注数据集和模拟分布，发现考虑标注者分歧时 \(K > 10\) 通常是最优的，且所需的总预算 \(N \times K\) 往往不超过 1000。
Forget Less by Learning from Parents Through Hierarchical Relationships: 本文提出 FLLP（Forget Less by Learning from Parents）框架，通过在双曲空间中建立概念之间的父子层次关系来缓解定制扩散模型（CDM）的灾难性遗忘，利用 Lorentz 流形的树状结构建模能力实现新概念学习时的知识保持和持续概念集成。
Formal Abductive Latent Explanations for Prototype-Based Networks: 本文针对原型网络（如ProtoPNet）的解释可能具有误导性的问题，提出了溯因潜在解释（ALE），在潜在空间中构造满足形式化保证的充分条件解释，无需调用外部求解器，算法可扩展到多种数据集上的标准分类和细粒度分类任务。
From Decision Trees to Boolean Logic: A Fast and Unified SHAP Algorithm: 本文提出Woodelf算法，通过将决策树集成模型转化为加权析取范式（WDNF）的伪布尔公式，在统一框架下实现了Background SHAP和Path-Dependent SHAP的线性时间计算，在大规模数据集上实现CPU 16-31倍、GPU 24-333倍的加速。
From Sequential to Recursive: Enhancing Decision-Focused Learning with Bidirectional Feedback: 本文首次提出递归决策聚焦学习（R-DFL）框架，通过在预测模块与优化模块之间引入双向反馈回路，突破了传统顺序式 DFL 的单向信息流限制，并设计了显式展开和隐式微分两种梯度传播方法，在报童问题和二部匹配问题上显著提升了最终决策质量。
GDBA Revisited: Unleashing the Power of Guided Local Search for Distributed Constraint Optimization: 针对 GDBA 在一般值域 DCOP 上表现不佳的问题，本文系统分析了三大病因（过于激进的违反条件、无界惩罚累积、不协调的惩罚更新），提出了 DGLS 框架，通过自适应违反条件、蒸发机制和同步方案全面释放引导式局部搜索的性能，在多种标准基准上大幅超越 SOTA。
Generating Sketches in a Hierarchical Auto-Regressive Process for Flexible Sketch Drawing Manipulation at Stroke-Level: 提出 Sketch-HARP 分层自回归草图生成框架，通过三阶段层次化过程（预测笔画嵌入→确定画布位置→生成绘制动作序列），首次实现草图绘制过程中的灵活笔画级操控，在替换/擦除/扩展等任务上显著优于 SketchEdit。
Guided Perturbation Sensitivity (GPS): Detecting Adversarial Text via Embedding Stability and Word Importance: 提出 Guided Perturbation Sensitivity (GPS) 框架，通过对重要词进行遮蔽并测量嵌入表示的稳定性变化来检测对抗文本样本，在3个数据集、3种攻击、2个模型上实现85%+检测准确率，且无需重训练即可跨数据集/攻击/模型泛化。
CAE: Hierarchical Semantic Alignment for Image Clustering: 结合名词级（WordNet）和描述级（Flickr 图片描述）两种互补语义，通过最优传输对齐构建语义空间并自适应融合，实现 training-free 的图像聚类，在 ImageNet-1K 上准确率提升 4.2%。
Higher-Order Responsibility: 本文研究顺序决策机制中的高阶责任问题，证明了两个核心定理：(1) \(n\) 个智能体的机制必然是 \(n\) 阶无间隙的（即总能找到某阶责任人）；(2) 判定机制是否为 \(d\) 阶无间隙的问题是 \(\Pi_{2d+1}\)-完全的。
How Hard is it to Explain Preferences Using Few Boolean Attributes?: 本文系统研究了用布尔属性模型（BAM）解释偏好数据的计算复杂性：证明了当属性数 \(k \geq 3\) 时问题是NP完全的，\(k \leq 2\) 时线性可解；进一步对投票人数 \(n\)、候选项数 \(m\)、属性数 \(k\) 等参数给出了完整的参数化复杂性全景图，并分析了已知部分信息（cares/has）时问题难度的变化。
How Hard Is It to Rig a Tournament When Few Players Can Beat or Be Beaten by the Favorite?: 本文提出两个新的结构化参数——目标选手在锦标赛有向图中的入度 \(k\) 和出度 \(\ell\)——用于分析锦标赛赛程操纵问题 (TFP)，证明 TFP 在以这两个参数为参数时均是 FPT 的，其中入度参数化的算法设计涉及复杂的结构分析和颜色编码技术。
How to Marginalize in Causal Structure Learning?: 本文利用可处理概率电路（Probabilistic Circuits）替代传统动态规划方法来执行贝叶斯结构学习中的边际化任务，通过一种新颖的两阶段训练策略（先学习完整父集分数再渐进式微调边际查询），消除了候选父节点集数量的人为限制，从而在 TRUST 框架上取得了更好的后验分布估计效果。
How Wide and How Deep? Mitigating Over-Squashing of GNNs via Channel Capacity Constrained Estimation: 本文从信息论视角出发，将谱图神经网络建模为通信信道，提出信道容量约束估计框架 C3E，将 GNN 隐藏维度与深度的选择形式化为一个非线性规划问题，在训练前即可估计最优架构参数，有效缓解信息过度压缩（over-squashing），在 9 个数据集上一致提升了表示学习效果。
Human Cognitive Biases in Explanation-based Interaction: The Case of Within and Between Session Order Effect: 本文通过两项大规模用户研究（总计 713 名参与者）系统评估了顺序效应（order effect）对解释性交互学习（XIL）的影响，发现顺序效应对用户反馈质量的影响有限且不一致，且仅在 session 内（而非 session 间）有显著但微弱的影响——总体结论是顺序效应不构成 XIL 实际应用的重大障碍。
HybriDLA: Hybrid Generation for Document Layout Analysis: HybriDLA 首次将扩散式边框精炼与自回归查询扩展统一在一个解码层中，模拟人类由粗到细的阅读策略来处理文档版面分析，在 DocLayNet 上纯视觉模型达到 83.5% mAP，逼近多模态系统。
HyperSHAP: Shapley Values and Interactions for Explaining Hyperparameter Optimization: HyperSHAP 提出一套基于 Shapley 值和 Shapley 交互的博弈论框架来解释超参数优化（HPO），通过定义消融、灵敏度、可调性和优化器偏差四类解释博弈，提供比 fANOVA 更具可操作性的超参数重要性分析。
I2E: Real-Time Image-to-Event Conversion for High-Performance Spiking Neural Networks: I2E 提出一个超高效的图像到事件流转换框架，通过模拟微扫视眼动并用高度并行化的卷积实现比先前方法快 300 倍以上的转换速度，首次支持 SNN 训练的在线数据增强，在 I2E-ImageNet 上达到 60.50% 的事件分类 SOTA，并通过合成数据预训练 + 真实数据微调的 sim-to-real 范式在 CIFAR10-DVS 上创下 92.5% 的历史最佳。
Improved Differentially Private Algorithms for Rank Aggregation: 针对差分隐私下的排名聚合问题，提出了改进的近似算法：首次研究footrule排名聚合问题并给出近最优算法（可推导出Kemeny问题的2-近似），同时通过结合二路边际查询和无偏估计技术改进了Kemeny排名聚合的PTAS加性误差（指数从3降至65/22）。
Improved Runtime Guarantees for the SPEA2 Multi-Objective Optimizer: 通过深入分析SPEA2更复杂的选择机制，证明了其种群动态与NSGA-II有本质不同（σ-准则使目标值在种群中均匀分布），从而得到了对种群大小依赖更弱的运行时上界，表明SPEA2对参数选择具有更强的鲁棒性。
Incremental Maintenance of DatalogMTL Materialisations: 提出 DRed\(_{\text{MTL}}\) 算法，将经典 Delete/Rederive 增量维护技术扩展到 DatalogMTL（带度量时序逻辑的 Datalog），通过在周期化物化表示上设计新的 seminaïve 评估算子和周期识别算法，实现高效增量更新，性能可达重新物化的数量级提升。
Intermediate N-Gramming: Deterministic and Fast N-Grams For Large N and Large Datasets: 提出 Intergrams 多遍扫描算法，利用较短 n-gram 作为前缀递推过滤候选更长 n-gram，充分利用处理器缓存层次结构实现缓存友好的内存访问模式，在 TB 级数据集上比此前最快的 hash-gramming 方法加速 6-33 倍，同时几乎精确恢复所有 top-k n-gram。
Judging by the Rules: Compliance-Aligned Framework for Modern Slavery Statement Monitoring: 提出以"合规对齐法官"（CA-Judge）为核心的训练框架，利用规则级对齐反馈训练 3B 参数的 CALLM 模型，使其生成基于法定条款的可追溯合规判断理由，在现代奴役声明的句子级合规分类任务上超越 GPT-4o 和 DeepSeek-R1。
LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval: 提出 LeanRAG 框架，通过语义聚合算法在层次化知识图谱的摘要节点间自动构建显式关系打破"语义孤岛"，并基于最近公共祖先（LCA）的自底向上检索策略高效导航层次结构，在四个 QA 基准上取得 SOTA 同时减少 46% 的检索冗余。
Learning Compact Latent Space for Representing Neural Signed Distance Functions with High-fidelity Geometry Details: 提出一种双分支架构（泛化分支+过拟合分支）来学习多个神经SDF的紧凑潜空间，结合共享spatial feature grid和新颖的带宽采样策略，在保持紧凑latent code的同时恢复高保真几何细节，在Stanford Models、ShapeNet和D-FAUST上均达到SOTA。
Learning Network Dismantling Without Handcrafted Inputs: 提出MIND（Message Iteration Network Dismantler），通过全新的All-to-One注意力机制和消息迭代轮廓（Message Iteration Profiles）消除GNN对手工特征的依赖，仅利用原始邻接信息就能在百万节点级真实网络上实现SOTA的网络拆解性能，同时具有最低的计算复杂度 \(O(|V|+|E|)\)。
Life, Machine Learning, and the Search for Habitability: Predicting Biosignature Fluxes for the Habitable Worlds Observatory: 本文为 NASA 宜居世界天文台（HWO）的系外行星观测优先级排序需求，提出贝叶斯卷积神经网络（BCNN）和新型光谱查询自适应 Transformer（SQuAT）两种架构，从行星反射光谱中预测生物标志物种类的通量，两者在增强数据集上均实现了高预测精度，且分别在不确定性量化和可解释性方面各有优势。
Local Guidance for Configuration-Based Multi-Agent Pathfinding: 提出局部引导（Local Guidance）概念改进 LaCAM 的多智能体路径规划，通过在每个配置生成步为每个智能体构造局部时空路径来缓解拥塞，最高可将解的代价降低 50%，同时保持 1000 智能体下几秒内完成。
Lost in Time? A Meta-Learning Framework for Time-Shift-Tolerant Physiological Signal Transformation: 提出 ShiftSyncNet，一个基于元学习双层优化的框架，通过 SyncNet 学习训练样本对之间的时间偏移量并利用傅里叶变换的相移性质自动校正标签对齐，在三个数据集上分别提升了 9.4%、6.0% 和 12.8% 的波形转换精度。
Measuring Model Performance in the Presence of an Intervention: 针对存在干预（intervention）时 AI 模型评估偏差的问题，提出 Nuisance Parameter Weighting (NPW) 方法，通过对 RCT 治疗组数据进行因果加权，实现无偏的 AUROC 估计，使样本效率提升 5 倍，显著改善了模型选择和假设检验的统计功效。
MicroEvoEval: A Systematic Evaluation Framework for Image-Based Microstructure Evolution Prediction: 提出 MicroEvoEval，首个面向图像级微观结构演化预测的标准化基准：涵盖 4 个代表性物理任务（平面波、晶粒生长、旋节分解、枝晶凝固）、14 个模型（5 个领域特定 + 9 个通用时空架构）、多维度评估（数值精度 + 物理保真度 + 计算效率），发现现代通用架构（如 VMamba）在长期稳定性和物理保真度上优于领域特定模型，且计算效率高一个数量级。
Model Change for Description Logic Concepts: 本文研究描述逻辑概念在面对以 pointed interpretation 表示的新模型时的修改问题，定义了驱逐(eviction)、接纳(reception)和修正(revision)三种操作，并为 EL 和 ALC 描述逻辑提供了兼容性的正面和负面理论结果。
Model Counting for Dependency Quantified Boolean Formulas: 本文首次研究了依赖量化布尔公式（DQBF）的模型计数问题，证明了即使仅含两个存在量词变量的 #2-DQBF 就已是 #EXP-完全的，并基于 BDD 符号可达性技术实现了一个实用的 2-DQBF 模型计数器 sharp2DQR，在大依赖集上显著优于基于展开的基线方法。
More Than Irrational: Modeling Belief-Biased Agents: 提出一种计算理性（CR）用户模型框架，将人类看似"不理性"的行为解释为在有限记忆（信念偏差）下的最优决策，通过嵌套粒子滤波（NPF）在线推断用户的潜在记忆界限参数 \(\theta\) 和偏差信念状态 \(\tilde{b}\)，PM误差在45步内降低90%，并在辅助POMDP中展示自适应AI助手策略。
Neural Graph Navigation for Intelligent Subgraph Matching: 提出 NeuGN（Neural Graph Navigation）框架，首次将生成式神经导航集成到子图匹配的核心枚举阶段，通过 QSExtractor 提取查询图结构信号 + GGNavigator 将暴力枚举转为结构感知的候选节点优先排序，在保证完备性的同时将 First Match Steps 最高减少 98.2%。
On the Edge of Core (Non-)Emptiness: An Automated Reasoning Approach to Approval-Based Multi-Winner Voting: 针对基于认可的多赢者投票中核稳定性（core stability）是否总存在这一重大开放问题，提出基于混合整数线性规划（MILP）的自动推理框架，证明了新的存在性结果，发现了核稳定性与其他公理（如 Lindahl 可定价性）之间此前未知的关系，并推翻了一个已有猜想。
On the Variability of Concept Activation Vectors: 对 TCAV 方法中概念激活向量（CAV）的变异性进行首次理论分析，证明 CAV 的方差以 \(O(1/N)\) 速率衰减（\(N\) 为随机样本数），而 TCAV 分数的方差因"边界点"保持 \(O(1)\)，需通过多次运行平均以 \(O(1/s)\) 降低。
Online Linear Regression with Paid Stochastic Features: 研究了在线线性回归中特征被噪声污染、学习者可以付费降低噪声强度的新问题设定，证明了已知噪声协方差时最优遗憾率为 \(\widetilde{\mathcal{O}}(\sqrt{T})\)、未知时为 \(\widetilde{\mathcal{O}}(T^{2/3})\)，并给出匹配的下界，所有界关于时间 \(T\) 的依赖都是阶最优的。
Optimal Welfare in Noncooperative Network Formation under Attack: 在Goyal等人(WINE 2016)提出的非合作网络形成博弈模型中，证明了自私智能体创建的均衡网络在面对包括maximum disruption在内的广泛攻击者类别（超二次扰动攻击者SQD）时，仍能维持渐近最优的社会福利\(n^2 - O(n)\)，解决了一个长期开放问题。
OR-R1: Automating Modeling and Solving of Operations Research Optimization Problems: OR-R1提出了一个数据高效的两阶段训练框架（SFT + TGRPO），仅使用ORLM所需1/10的合成数据即达到67.7%的平均求解准确率，超越现有SOTA方法，并通过测试时强化学习将单次生成（Pass@1）与多次生成（Pass@8）的性能差距从13%缩小到7%。
ParaMETA: Towards Learning Disentangled Paralinguistic Speaking Styles Representations: 提出 ParaMETA，一种统一的副语言说话风格表示学习框架，通过 META 空间正则化和任务特定子空间投影实现情感、年龄、性别、语言等说话风格的解耦表示，同时支持下游的多任务分类和风格可控语音合成。
ParaRevSNN: A Parallel Reversible Spiking Neural Network for Efficient Training and Inference: 提出ParaRevSNN，一种并行可逆脉冲神经网络架构，通过重新设计可逆块间的数据依赖关系解耦顺序计算约束，在保持可逆性（内存高效）的同时实现块间并行，训练时间减少最多35.2%，推理时间降至18.15%。
PIPHEN: Physical Interaction Prediction with Hamiltonian Energy Networks: 提出PIPHEN分布式物理认知-控制框架，通过物理交互预测网络（PIPN）进行"语义蒸馏"将高维感知数据压缩至原始数据量的5%以下，再由基于哈密顿能量守恒的HEN控制器生成协调动作，从而解决多机器人系统的"共享大脑困境"。
Predict and Resist: Long-Term Accident Anticipation under Sensor Noise: 提出统一框架，将基于扩散模型的双层去噪模块与时间感知的Actor-Critic强化学习模型结合，在传感器噪声条件下实现鲁棒的长期交通事故预测，在三个基准数据集上取得了准确率（AP）和平均事故前预警时间（mTTA）的最优性能。
Private Frequency Estimation via Residue Number Systems: 提出 ModularSubsetSelection (MSS)，一种基于剩余数系统（RNS）的本地差分隐私频率估计协议，在保持与 SubsetSelection 和 PGR 相当的估计精度的同时，显著降低通信开销（比 SS 减少达一半）、大幅加速服务器解码（比 PGR 快 11-448 倍）、并实现最低的数据重建攻击成功率。
Provably Data-Driven Projection Method for Quadratic Programming: 将数据驱动的投影矩阵学习从线性规划（LP）扩展到凸二次规划（QP），通过提出"展开主动集方法"在 Goldberg-Jerrum 框架下建模 QP 最优值的计算过程，从而建立了投影矩阵学习的伪维度上界和泛化保证。
Radar-APLANC: Unsupervised Radar-based Heartbeat Sensing via Augmented Pseudo-Label and Noise Contrast: 提出首个雷达心跳感知的无监督学习框架 Radar-APLANC，通过噪声对比三元组损失（NCT loss）和增强伪标签生成器实现两阶段无监督训练，无需昂贵的生理信号标注即可达到接近监督方法的性能。
Regular Games – an Automata-Based General Game Playing Language: 提出 Regular Games (RG) 通用博弈系统，以非确定性有限自动机（NFA）为核心描述博弈规则，配合多层次语言（底层 RG + 高层 HRG + 专用框架），在表达力覆盖所有有限回合制博弈（含不完全信息和随机性）的同时，生成的前向模型效率全面超越现有最快的通用博弈系统 RBG，通常比 Ludii 快 10-20 倍。
Reward Redistribution via Gaussian Process Likelihood Estimation: 本文提出了基于高斯过程似然的奖励重分配框架 GP-LRR，通过核函数显式建模 state-action 对之间的相关性，利用 leave-one-out 策略最大化轨迹回报的边际似然来学习逐步奖励函数，理论证明传统 MSE 方法是其退化特例，并在 MuJoCo 基准上配合 SAC 实现了优越的样本效率和策略性能。
Sampling Control for Imbalanced Calibration in Semi-Supervised Learning: 提出 SC-SSL 框架，通过引入扩展分类器进行解耦采样控制来缓解特征级不平衡，并利用线性层偏置项作为优化偏差向量在推理时直接校准 logits，在多种数据分布设定下达到 SOTA。
Scalable Vision-Guided Crop Yield Estimation: 提出基于预测驱动推断（PPI++）的农作物产量估计方法，利用田间照片训练的视觉模型补充昂贵的实地测产数据，在保证无偏性的同时将有效样本量提升高达 73%，为区域农业保险提供更精确且低成本的产量估计。
Semi-Supervised High Dynamic Range Image Reconstructing via Bi-Level Uncertain Area Masking: 提出半监督 HDR 重建框架，通过不确定性估计分支评估伪 HDR 标签质量，在 patch 和像素两个层面掩码不可靠区域，仅用 6.7% HDR 真值即可达到与全监督 SOTA 可比的性能。
Spike Imaging Velocimetry: Dense Motion Estimation of Fluids Using Spike Cameras: 提出 Spike Imaging Velocimetry（SIV），首次将脉冲相机（20000Hz 超高时间分辨率）应用于流体测速，设计细节保持层次变换（DPHT）、图编码器（GE）和多尺度速度精炼（MSVR）三个针对流体特性的模块，并构建了 PSSD 数据集，在稳态湍流、高速流和 HDR 场景上全面超越现有基线。
STEM Faculty Perspectives on Generative AI in Higher Education: 通过对美国一所大型公立大学 29 名 STEM 教师的焦点小组研究，揭示教师如何在教学中整合 GenAI、观察到的学生学习益处与挑战，以及所需的制度支持——发现 GenAI 将教师劳动从内容创建转向专家审核，且可能掩盖学生能力不足。
Structural Approach to Guiding a Present-Biased Agent: 在Kleinberg-Oren模型的委托-代理扩展中，系统性地研究了T-path-Editing问题的参数化复杂性，给出了以树宽和路径代价多样性为参数的FPT算法，并建立了紧的困难性结果，全面刻画了引导当前偏差agent完成关键任务的可处理-不可处理边界。
Structure-Aware Encodings of Argumentation Properties for Clique-width: 本文设计了从抽象论辩问题到(Q)SAT的有向分解引导(DDG)归约，线性保持团宽(clique-width)，为所有常见论辩语义（stable、admissible、complete、preferred、semi-stable、stage）在扩展存在性、论元接受性和计数问题上建立了以团宽为参数的可处理性上界，并证明了在ETH假设下这些归约的开销不可显著改进。
Symbolic Planning and Multi-Agent Path Finding in Extremely Dense Environments with Unassigned Agents: 提出 Block Rearrangement Problem (BRaP) 形式化定义，并设计五种基于配置空间搜索、PDDL 符号规划和 MAPF 的求解算法，其中 BR-LaCAM 在最大 80×80 的极端密集网格上达到 92% 成功率和毫秒级求解速度。
SynWeather: Weather Observation Data Synthesis across Multiple Regions and Variables via a General Diffusion Transformer: 构建了首个支持统一多区域多变量的气象观测数据合成数据集SynWeather（覆盖4个区域×4种变量×6颗卫星），并提出基于Diffusion Transformer的通用概率生成模型SynWeatherDiff，通过文本提示引导在多个合成任务上超越专用模型和现有通用模型。
Tab-PET: Graph-Based Positional Encodings for Tabular Transformers: Tab-PET 提出从表格特征间关联关系中估计图结构，利用图拉普拉斯特征向量构造位置编码（PE）注入 Tabular Transformer，理论和实验均证明 PE 可降低嵌入的有效秩从而提升泛化，在 50 个数据集上为 TabTransformer / SAINT / FT-Transformer 带来一致改进，且 Spearman 关联图效果最佳。
TaylorPODA: A Taylor Expansion-Based Method to Improve Post-Hoc Attributions for Opaque Models: 在Taylor展开框架下提出精确性(precision)、联合性(federation)、零偏差(zero-discrepancy)三个公设规范特征归因，并引入自适应属性(adaptation)通过AUP目标优化交互效应的分配权重，成为唯一同时满足所有公设和属性的事后模型无关归因方法。
TDSNNs: Competitive Topographic Deep Spiking Neural Networks for Visual Cortex Modeling: 提出拓扑深度脉冲神经网络（TDSNNs），通过设计时空约束（STC）损失函数，在深层SNN中成功复现灵长类视觉皮层从V1到IT的层级拓扑组织，既保持了高任务性能（ImageNet top-1无精度下降），又显著超越现有拓扑ANN的脑相似性。
The Limitations and Power of NP-Oracle-Based Functional Synthesis Techniques: 系统性地从理论层面研究了依赖NP预言机的函数综合方法的能力与局限，证明了朴素的逐位学习方法在多输出场景下必然失败、基于Resolution插值的方法会产生指数级电路，同时证明了NP预言机是高效综合的必要条件，并给出了利用NP预言机在多项式时间内综合小规模Skolem函数的正面结果。
The Publication Choice Problem: 提出"出版选择问题"这一博弈论框架，建模研究者的出版策略与期刊影响力之间的双向互动关系，证明了纯策略均衡的存在性和唯一性，并分析了 Spotlight 论文标签对学术生态的影响。
Theoretical and Empirical Analysis of Lehmer Codes to Search Permutation Spaces with Evolutionary Algorithms: 首次对 Lehmer 编码（逆序向量）在进化算法中搜索排列空间的效率进行严格的数学运行时分析，证明 Lehmer 编码的 EA 在多数基准函数上达到 \(O(n^2 \log n)\) 或 \(O(n^2)\) 的期望运行时间，与经典表示持平或更优，并在 LOP 和 QAP 实际问题上验证其实用性。
Think How Your Teammates Think: Active Inference Can Benefit Decentralized Execution: 提出 AIM（Active Inference Modeling）框架，在去中心化多智能体强化学习中，不依赖通信机制，仅基于局部观测建模队友的主动推理过程（感知-信念-动作三重肖像），并通过准确性-相关性双重过滤机制选择性融合队友信念，在 SMAC、SMACv2、MPE 和 GRF 四大基准上取得最优或接近最优表现。
ASAG: Toward the Frontiers of Reliable Diffusion Sampling via Adversarial Sinkhorn Attention Guidance: 提出 ASAG（Adversarial Sinkhorn Attention Guidance），从最优传输理论角度重新解读扩散模型中的自注意力分数，通过 Sinkhorn 算法在注意力层中注入对抗性传输代价来故意降低 query-key 相似度，从而破坏误导性注意力对齐并提升条件/无条件采样质量，方法轻量、即插即用、无需重训练。
Towards a Rigorous Understanding of the Population Dynamics of the NSGA-III: Tight Runtime Bounds: 本文首次为 NSGA-III 在经典双目标 OneMinMax 基准上建立了紧致运行时界 \(\Theta(n^2 \ln n / \mu)\)，揭示了 NSGA-III 的种群动态特性，并证明其在适当种群规模下优于 NSGA-II。
Tractable Weighted First-Order Model Counting with Bounded Treewidth Binary Evidence: 提出一种在域大小上多项式时间的算法，计算带有有界树宽二元证据的 \(\text{FO}^2\) 和 \(\text{C}^2\) 片段的加权一阶模型计数（WFOMC），并解决了有界树宽有界度图上的稳定座位安排开放问题。
Variance Computation for Weighted Model Counting with Knowledge Compilation Approach: 本文将加权模型计数 (WMC) 的权重视为具有方差的随机变量，提出在 structured d-DNNF 表示上多项式时间计算 WMC 方差的算法，同时证明了在 structured DNNF、d-DNNF 和 FBDD 上该问题不可解（除非 P=NP），并将其应用于贝叶斯网络推理中参数不确定性的量化。
Why Isn't Relational Learning Taking Over the World?: 本文是一篇 position paper，深入分析了关系学习（relational learning）未能在 AI 领域占据主导地位的原因——包括数据集不够真实、评估方法存在根本缺陷、缺少负例、聚合操作的理论困境等——并指出了让关系学习发挥应有潜力所需的关键改进方向。