跳转至

📂 其他

🤖 AAAI2026 · 126 篇论文解读

📌 同领域跨会议浏览: 💬 ACL2026 (5) · 📷 CVPR2026 (54) · 🔬 ICLR2026 (76) · 🧠 NeurIPS2025 (154) · 📹 ICCV2025 (48) · 🧪 ICML2025 (93)

🔥 高频主题: Agent ×10 · 对抗鲁棒 ×5 · 扩散模型 ×5 · 对齐/RLHF ×3 · 推理 ×2

A Fast Heuristic Search Approach for Energy-Optimal Profile Routing for Electric Vehicles

提出基于多目标A搜索的label-setting方法(Pr-A),在初始电量未知时高效求解电动车能耗最优路径(profile搜索),通过profile支配关系剪枝避免传统方法中复杂的profile合并操作,在大规模路网上性能接近已知初始电量的标准A*搜索。

A Graph-Theoretical Perspective on Law Design for Multiagent Systems

从图论角度研究多智能体系统中的法律设计问题,将 useful law 和 gap-free law 的最小化设计分别归约为超图的顶点覆盖问题,证明了 NP-hardness 并给出近似算法。

A New Strategy for Verifying Reach-Avoid Specifications in Neural Feedback Systems

提出FaBRe(Forward and Backward Reachability)策略,首次开发了针对ReLU神经网络控制器的后向可达集过近似和欠近似算法(GSS/ICH/LEB),并将其与前向可达性分析结合,构成统一的reach-avoid验证框架,旨在突破纯前向分析的可扩展性瓶颈。

A Phase Transition for Opinion Dynamics with Competing Biases

在有向随机图上建模两种对立力量(外部颠覆性偏差 vs 个体顽固性)对二元观点传播的影响,证明系统存在尖锐相变:偏差超过临界阈值 \(p_c\) 时群体快速达成新共识,低于阈值则长期处于亚稳极化状态,且临界点仅由度序列的两个简单统计量决定。

A Switching Framework for Online Interval Scheduling with Predictions

针对不可撤销的在线区间调度问题,提出 SemiTrust-and-Switch 框架和 SmoothMerge 随机算法,通过在信任预测和经典贪心算法之间切换/融合,在预测准确时趋近最优(一致性),预测错误时性能优雅退化(鲁棒性和平滑性),并证明了该框架在特定实例上的紧性。

A Topological Rewriting of Tarski's Mereogeometry

在 Coq 定理证明器中扩展 λ-MM 库,将基于 Leśniewski 部分学(mereology)的 Tarski 固体几何重写为具备完整拓扑结构的形式化系统,证明部分学类对应正则开集、满足 Kuratowski 内部公理且具有 Hausdorff(T2)性质,从而为定性空间推理提供了统一的部分学-几何-拓扑理论框架。

UniShape: A Unified Shape-Aware Foundation Model for Time Series Classification

提出UniShape——首个面向时间序列分类(TSC)的形状感知基础模型:通过多尺度子序列(shape)自适应聚合的shape-aware adapter捕获类别判别性时序模式,结合原型预训练模块在实例级和shape级联合学习可迁移的shapelet表示;在189万样本上预训练后,128个UCR数据集上达到0.8708平均准确率,超越所有基线。

Agent-SAMA: State-Aware Mobile Assistant

提出Agent-SAMA,首次将有限状态机(FSM)引入移动端GUI Agent,将UI屏幕建模为状态、用户操作建模为转移,通过四个专门化Agent协作实现状态感知的任务规划、执行验证和错误恢复,在跨App基准上成功率提升最高12%、恢复率提升13.8%。

Align When They Want, Complement When They Need! Human-Centered Ensembles for Adaptive Human-AI Collaboration

揭示了人机协作中"互补性"(complementarity)与"对齐性"(alignment)之间存在根本性权衡——单一模型无法同时优化二者,提出自适应AI集成框架,通过Rational Routing Shortcut(RRS)机制在对齐模型和互补模型之间动态切换,团队准确率较标准AI提升最高9%。

AMS-IO-Bench and AMS-IO-Agent: Benchmarking and Structured Reasoning for Analog and Mixed-Signal Integrated Circuit Input/Output Design

提出AMS-IO-Agent,一个基于LLM的领域专用智能体,通过结构化意图图(Intent Graph)和领域知识库将自然语言设计意图转化为可生产的模拟混合信号IC I/O环设计,配套提出首个AMS I/O环自动化基准AMS-IO-Bench,在28nm CMOS流片中验证了智能体生成的I/O环可直接用于实际芯片制造。

An Epistemic Perspective on Agent Awareness

本文首次将 agent awareness(智能体感知/意识)视为一种知识形式,区分了 de re(关于物理对象的)和 de dicto(关于概念/描述的)两种感知模态,并基于 2D 语义学提出了一个可靠且完备的逻辑系统来刻画这两种模态与标准"事实知识"模态之间的相互作用。

Approximation Algorithm for Constrained k-Center Clustering: A Local Search Approach

研究带 cannot-link (CL) 和 must-link (ML) 实例级约束的 k-center 聚类问题,提出基于支配匹配集(dominating matching set, DMS)转化的局部搜索框架,在不相交 CL 集条件下首次通过局部搜索达到最优近似比 2,解决了该领域一个开放问题。

Area-Optimal Control Strategies for Heterogeneous Multi-Agent Pursuit

研究异构速度下多追逐者-单逃避者的追逃博弈——定义逃避者安全可达集为所有追逐者-逃避者对的 Apollonius 圆的交集,将捕获策略建模为追逐者最小化/逃避者最大化该交集面积的零和博弈,推导出闭式瞬时最优航向控制律,仿真验证追逐者可系统性缩小安全区域实现保证捕获。

Automated Reproducibility Has a Problem Statement Problem

提出基于科学方法的可复现性形式化问题定义,将经验性AI研究表示为假设-实验-解释的图结构,并用LLM自动从20篇论文中提取该结构,经原作者评审验证其有效性。

Autonomous Concept Drift Threshold Determination

证明了固定阈值不可能在所有场景下最优、动态阈值严格优于静态阈值,并提出DTD算法:在漂移检测信号触发后启动三模型比较阶段,根据候选模型表现自适应调整检测阈值。

Bandit Learning in Housing Markets

本文首次将多臂老虎机(MAB)框架引入住房市场(单边匹配市场),定义了基于核(core)概念的遗憾值,并分别提出去中心化 ETC 和中心化 UCB 两种算法,证明了 \(\mathcal{O}(N\log T / \Delta_{\min}^2)\) 的去中心化遗憾上界与匹配的下界,建立了阶最优性。

Bayesian Network Structural Consensus via Greedy Min-Cut Analysis

提出 MCBNC 算法,基于最小割(min-cut)分析量化边的结构支持度,并将其嵌入贪心等价搜索(GES)的后向阶段来迭代剪枝融合贝叶斯网络中的冗余边,在不访问数据的情况下生成更稀疏、更精确的共识结构,适用于联邦学习场景。

Beyond World Models: Rethinking Understanding in AI Models

本文通过三个来自科学哲学的案例研究(多米诺计算机、数学证明、玻尔原子理论),论证世界模型(world models)框架不足以刻画人类级别的"理解",指出仅靠追踪状态和状态转换无法捕获理解所需的抽象推理、动机洞察和问题情境把握能力。

Bilevel MCTS for Amortized O(1) Node Selection in Classical Planning

提出双层MCTS(Bilevel MCTS),在MCTS选中的叶节点处运行深度比例预算的最优优先搜索,将节点选择均摊复杂度从 \(O(\log N)\) 降至 \(O(1)\),辅以树崩塌(Tree Collapsing)减少动作选择步数,最终整合为 Nεbula 规划器,在IPC2018/2023基准上以192.2/230.6解题数(5min/30min)超越LAMA、DecStar、NOLAN、SM-Type-LAMA等全部SOTA。

Bipartite Mode Matching for Vision Training Set Search from a Hierarchical Data Server

提出层级数据服务器 + 二部图模式匹配(BMM)框架,通过多粒度层级聚类组织大规模源数据、用匈牙利算法一对一匹配源域和目标域的语义模式(modes),从而搜索出与目标域分布差距最小的训练集,在行人重识别和目标检测任务上显著优于已有训练集搜索方法。

Boosting Adversarial Transferability via Ensemble Non-Attention

提出 NAMEA(Non-Attention Meta Ensemble Attack),首次利用集成模型的非注意力区域(non-attention areas)融合 CNN 和 ViT 的可迁移信息,结合元学习梯度优化,在跨架构对抗迁移性上平均超越 SOTA 方法 AdaEA 和 SMER 分别 15.0% 和 9.6%。

Bridging the Skills Gap: A Course Model for Modern Generative AI Education

本文提出了一个面向本科和研究生计算机科学学生的生成式 AI 应用课程模型,通过混合方法调查表明该课程在弥合产业界与学术界之间的生成式 AI 技能差距方面效果显著,学生普遍认为课程有价值且有效。

Cash Flow Underwriting with Bank Transaction Data: Advancing MSME Financial Inclusion in Malaysia

提出基于银行流水数据的端到端现金流承保工作流,构建首个马来西亚 MSME(中小微企业)银行账单数据集(611 条贷款记录),验证银行交易衍生特征相比传统申请信息可将逻辑回归模型的 AUROC 从 0.672 提升至 0.850,显著增强对缺乏信用记录的中小微企业的信用评估能力。

CASL: Curvature-Augmented Self-supervised Learning for 3D Anomaly Detection

发现点云曲率本身就是强大的异常检测线索,提出曲率增强的自监督学习框架 CASL,通过多尺度曲率提示引导坐标重建来学习通用 3D 表征,无需任何异常检测专用机制即可在 Real3D-AD 上以 5.6% O-AUROC 优势刷新 SOTA。

CAT-Net: A Cross-Attention Tone Network for Cross-Subject EEG-EMG Fusion Tone Decoding

提出 CAT-Net(Cross-Attention Tone Network),通过空间-时间特征提取分支 + 交叉注意力融合机制 + 域对抗训练,仅用 20 个 EEG 通道和 5 个 EMG 通道实现中文四声调分类,在有声/无声语音条件下分别达到 87.83%/88.08% 准确率,跨被试评估下达到 83.27%/85.10%,全面超越 8 种基线方法。

CellStream: Dynamical Optimal Transport Informed Embeddings for Reconstructing Cellular Trajectories from Snapshots Data

提出 CellStream,一种将自编码器与非平衡动态最优传输(unbalanced dynamical OT)联合学习的深度学习框架,从离散时间点的单细胞快照数据中同时学习低维嵌入和连续细胞动态轨迹,在时间一致性和速度一致性上显著优于现有方法。

Center-Outward q-Dominance: A Sample-Computable Proxy for Strong Stochastic Dominance in Multi-Objective Optimisation

基于最优传输理论中的中心向外分布函数,提出 q-dominance 关系作为强一阶随机支配(strong FSD)的可计算近似,证明全分位数范围的 q-dominance 可推导出强 FSD,并给出显式样本量阈值控制 Type I 错误,在超参数调优排名和噪声多目标优化中验证了其实用性。

Certified Branch-and-Bound MaxSAT Solving (Extended Version)

为 Branch-and-Bound MaxSAT 求解器实现了基于 VeriPB 证明系统的认证,覆盖了 look-ahead 边界方法和多值决策图(MDD)编码两大核心技术,在 MaxCDCL 求解器上的实验表明证明日志的中位开销仅 19%,填补了 MaxSAT 求解范式认证的最后空白。

Certified but Fooled! Breaking Certified Defences with Ghost Certificates

提出 GhostCert,一种基于显著性区域的对抗攻击方法,能在保持扰动不可感知的同时误导分类器并伪造大半径的认证证书(ghost certificates),在 ImageNet 上对包括 DensePure 在内的 SOTA 认证防御取得显著优于 Shadow Attack 的攻击成功率和更大的伪造认证半径。

Clinician-in-the-Loop Smart Home System to Detect Urinary Tract Infection Flare-Ups via Uncertainty-Aware Decision Support

提出一种临床医师参与闭环的智能家居系统,利用环境传感器数据提取行为标记,结合新颖的共形校准区间(CCI)方法量化预测不确定性,实现对老年人尿路感染(UTI)发作的可靠检测与"不确定时弃权"的决策支持。

CompTrack: Information Bottleneck-Guided Low-Rank Dynamic Token Compression for Point Cloud Tracking

提出CompTrack——首个同时解决LiDAR点云中空间冗余和信息冗余双重挑战的3D单目标跟踪框架:空间前景预测器(SFP)基于信息熵过滤背景噪声,信息瓶颈引导的动态Token压缩(IB-DTC)模块利用在线SVD估计有效秩并将前景压缩为紧凑代理token;在nuScenes和Waymo上达到SOTA,同时以90 FPS实时运行。

Controllable Financial Market Generation with Diffusion Guided Meta Agent

提出Diffusion Guided Meta Agent(DigMA)模型,将可控金融市场生成形式化为条件生成任务,用条件扩散模型捕捉市场状态动态(中间价收益率与订单到达率的时变分布参数),结合具有金融经济学先验的Meta Agent生成订单流,在可控性和生成保真度上均超越现有方法。

Cost-Free Neutrality for the River Method

针对River投票方法的并行宇宙打破平局(PUT)问题,证明其获胜者集合可在多项式时间内计算(相比Ranked Pairs的NP-完全性),提出Fused-Universe(FUN)算法,一次遍历同时模拟所有可能的打破平局方式,并为每个获胜者提供构造性证书。

Data Complexity of Querying Description Logic Knowledge Bases under Cost-Based Semantics

系统研究加权描述逻辑知识库在代价语义下的查询应答的数据复杂度,证明最优代价语义在\(\Delta_2^p\)内可解,并给出一个令人惊喜的正面结果:在DL-Lite\(_{\text{bool}}^{\mathcal{H}}\)本体和固定代价界限下,实例查询的确定回答和合取查询的可能回答可通过一阶重写实现最低数据复杂度(AC\(^0\))。

Deadline-Aware, Energy-Efficient Control of Domestic Immersion Hot Water Heaters

提出一种基于截止时间感知的家用热水器节能控制方法,通过 Gymnasium 仿真环境比较 bang-bang 基线、MCTS 规划器和 PPO 策略,证明 PPO 在相同物理条件下能节省高达 69% 的能量。

Decomposition and Preprocessing of Ternary Constraint Networks

提出将任意离散约束网络形式化分解为三元约束网络(TCN)的完整理论框架,并通过七项预处理技术(传播、代数简化、公共子表达式消除等)将分解引入的变量/约束膨胀从中位数8x/6x降至4.8x/4.3x,为GPU硬件上的高效约束求解提供规则化数据布局。

DECOR: Deep Embedding Clustering with Orientation Robustness

提出 DECOR 框架,通过旋转不变的等变卷积自编码器(RCAE)+ 非参数聚类(DeepDPM)+ 集成异常检测,实现晶圆图缺陷模式的方向鲁棒聚类。

DeepRWCap: Neural-Guided Random-Walk Capacitance Solver for IC Design

提出 DeepRWCap,一种机器学习引导的随机游走电容求解器,通过两阶段神经网络架构预测转移核来加速IC设计中的多介质域电容提取,在10个工业测试案例上实现平均1.24%误差和23%加速。

Depth-Synergized Mamba Meets Memory Experts for All-Day Image Reflection Separation

提出 DMDNet,通过深度感知扫描策略(DAScan)引导 Mamba 关注显著结构,结合深度协同状态空间模型(DS-SSM)抑制模糊特征传播,并引入记忆专家补偿模块(MECM)利用跨图像历史知识,实现全天候(白天+夜间)的图像反射分离。

Description Logics with Two Types of Definite Descriptions: Complexity, Expressiveness, and Automated Deduction

引入描述逻辑 ALC 的两种定冠描述扩展——局部定冠描述 \(\{ι C\}\) 和全局定冠描述 \(ι C.D\),证明三个扩展逻辑的可满足性问题均为 ExpTime-complete,但全局定冠描述严格比局部更具表达力(\(\mathcal{ALC}\iota_L < \mathcal{ALC}\iota_G = \mathcal{ALC}\iota\)),并给出表列演算决策过程及实验评估。

Designing Incident Reporting Systems for Harms from General-Purpose AI

通过文献综述和九个安全关键行业(核能、航空、医疗等)的案例研究,提出了 AI 事件报告系统制度设计的七维框架,为美国通用 AI 事件报告的政策设计提供系统性指导。

DeToNATION: Decoupled Torch Network-Aware Training on Interlinked Online Nodes

提出 FlexDeMo——一种将全分片数据并行(FSDP)与解耦动量优化相结合的混合分片训练策略,在节点内使用 FSDP 分片、节点间仅同步快速移动的动量分量,实现了接近全同步 AdamW 的损失收敛同时显著加速训练。

Deviation Dynamics in Cardinal Hedonic Games

本文在基数享乐博弈(cardinal hedonic games)的动态模型中提出元定理,证明偏离动态可能收敛或必然收敛的判定复杂度可以直接从不存在稳定结果的实例推导得出,并在加性可分享乐博弈中提出利用偏离动态寻找个体理性和合同个体稳定分区的方法。

DFDT: Dynamic Fast Decision Tree for IoT Data Stream Mining on Edge Devices

提出 DFDT(Dynamic Fast Decision Tree),一种面向 IoT 边缘设备的内存受限数据流挖掘算法,通过活动感知预剪枝、动态 grace period、自适应 tie threshold 三重机制有机调控树的增长,实现精度-内存-运行时间的最优权衡。

DiffMM: Efficient Method for Accurate Noisy and Sparse Trajectory Map Matching via One Step Diffusion

提出 DiffMM,首次将扩散模型引入地图匹配任务,通过路段感知轨迹编码器和一步 Shortcut 扩散过程,在稀疏轨迹和复杂路网上实现了精度和效率的双重提升,推理速度比次优方法快约 17 倍。

DS-ATGO: Dual-Stage Synergistic Learning via Forward Adaptive Threshold and Backward Gradient Optimization for Spiking Neural Networks

针对SNN训练中因膜电位分布偏移导致的脉冲发放不均衡和梯度消失问题,提出前向自适应阈值+后向阈值驱动梯度优化的双阶段协同学习算法DS-ATGO,在CIFAR10/100和ImageNet上以低时延实现SOTA性能。

Enhancing Control Policy Smoothness by Aligning Actions with Predictions from Preceding States

提出 ASAP(Action Smoothing by Aligning Actions with Predictions from Preceding States),一种基于转移诱导相似状态定义的强化学习动作平滑方法,通过空间约束(对齐前一状态的预测动作)和时间约束(惩罚二阶动作差异)有效抑制高频动作振荡,在 Gymnasium 和 Isaac-Lab 环境中优于现有方法。

Enhancing Noise Resilience in Face Clustering via Sparse Differential Transformer

提出预测驱动的 Top-K Jaccard 相似度系数提升邻居纯度,配合稀疏差分 Transformer(SDT)消除噪声注意力,在 MS-Celeb-1M 等大规模人脸聚类数据集上达到 SOTA 性能。

Expandable and Differentiable Dual Memories with Orthogonal Regularization for Exemplar-free Continual Learning

提出 EDD(Expandable and Differentiable Dual Memory),一种无需存储旧样本的持续学习方法,通过可微分的共享记忆和任务特定记忆将数据分解为可复用的子特征,结合记忆扩展-剪枝正交正则化机制,在 CIFAR-10/100 和 Tiny-ImageNet 上超越 14 种 SOTA 方法,最终准确率分别达到 55.13%、37.24% 和 30.11%。

Expressive Temporal Specifications for Reward Monitoring

利用量化线性时序逻辑(LTLf[F])自动合成量化奖励监控器(QRM),为强化学习智能体在运行时生成密集的连续值奖励流,从根本上缓解布尔语义下长时任务的稀疏奖励问题。

Extreme Value Monte Carlo Tree Search for Classical Planning

利用 Peaks-Over-Threshold 极值理论(POT EVT)为经典规划中 MCTS 的 Full Bellman Backup 提供统计理论基础,提出 UCB1-Uniform bandit 算法,用均匀分布(Generalized Pareto 的特例)的 MLE 估计指导动作选择,在 Pyperplan 上以 \(10^4\) 节点预算超越 GBFS 67.8 个实例、超越 Softmin-Type(h) 33.2 个实例。

Faster Certified Symmetry Breaking Using Orders With Auxiliary Variables

通过引入辅助变量编码字典序来替代大整数编码,对 VeriPB 证明系统进行本质重设计,使 SAT 对称性破坏的证明生成和验证在理论和实践上均获得数量级加速。

Finding Diverse Solutions Parameterized by Cliquewidth

将"寻找多样化解"的参数化框架从treewidth扩展到更强的cliquewidth图参数,证明任何基于cliquewidth分解的单调动态规划都可以以极小额外开销转换为求解多样化版本的算法,并提出了一族新的Venn多样性度量函数。

Forest vs Tree: The (N, K) Trade-off in Reproducible ML Evaluation

本文研究机器学习评估中样本数量 \(N\) 和每个样本标注者数量 \(K\) 之间的最优权衡:在固定预算 \(N \times K\) 下,通过分析多类别标注数据集和模拟分布,发现考虑标注者分歧时 \(K > 10\) 通常是最优的,且所需的总预算 \(N \times K\) 往往不超过 1000。

Forget Less by Learning from Parents Through Hierarchical Relationships

本文提出 FLLP(Forget Less by Learning from Parents)框架,通过在双曲空间中建立概念之间的父子层次关系来缓解定制扩散模型(CDM)的灾难性遗忘,利用 Lorentz 流形的树状结构建模能力实现新概念学习时的知识保持和持续概念集成。

Formal Abductive Latent Explanations for Prototype-Based Networks

本文针对原型网络(如ProtoPNet)的解释可能具有误导性的问题,提出了溯因潜在解释(ALE),在潜在空间中构造满足形式化保证的充分条件解释,无需调用外部求解器,算法可扩展到多种数据集上的标准分类和细粒度分类任务。

From Decision Trees to Boolean Logic: A Fast and Unified SHAP Algorithm

本文提出Woodelf算法,通过将决策树集成模型转化为加权析取范式(WDNF)的伪布尔公式,在统一框架下实现了Background SHAP和Path-Dependent SHAP的线性时间计算,在大规模数据集上实现CPU 16-31倍、GPU 24-333倍的加速。

From Sequential to Recursive: Enhancing Decision-Focused Learning with Bidirectional Feedback

本文首次提出递归决策聚焦学习(R-DFL)框架,通过在预测模块与优化模块之间引入双向反馈回路,突破了传统顺序式 DFL 的单向信息流限制,并设计了显式展开和隐式微分两种梯度传播方法,在报童问题和二部匹配问题上显著提升了最终决策质量。

Guided Perturbation Sensitivity (GPS): Detecting Adversarial Text via Embedding Stability and Word Importance

提出 Guided Perturbation Sensitivity (GPS) 框架,通过对重要词进行遮蔽并测量嵌入表示的稳定性变化来检测对抗文本样本,在3个数据集、3种攻击、2个模型上实现85%+检测准确率,且无需重训练即可跨数据集/攻击/模型泛化。

CAE: Hierarchical Semantic Alignment for Image Clustering

结合名词级(WordNet)和描述级(Flickr 图片描述)两种互补语义,通过最优传输对齐构建语义空间并自适应融合,实现 training-free 的图像聚类,在 ImageNet-1K 上准确率提升 4.2%。

Higher-Order Responsibility

本文研究顺序决策机制中的高阶责任问题,证明了两个核心定理:(1) \(n\) 个智能体的机制必然是 \(n\) 阶无间隙的(即总能找到某阶责任人);(2) 判定机制是否为 \(d\) 阶无间隙的问题是 \(\Pi_{2d+1}\)-完全的。

How Hard is it to Explain Preferences Using Few Boolean Attributes?

本文系统研究了用布尔属性模型(BAM)解释偏好数据的计算复杂性:证明了当属性数 \(k \geq 3\) 时问题是NP完全的,\(k \leq 2\) 时线性可解;进一步对投票人数 \(n\)、候选项数 \(m\)、属性数 \(k\) 等参数给出了完整的参数化复杂性全景图,并分析了已知部分信息(cares/has)时问题难度的变化。

How Hard Is It to Rig a Tournament When Few Players Can Beat or Be Beaten by the Favorite?

本文提出两个新的结构化参数——目标选手在锦标赛有向图中的入度 \(k\) 和出度 \(\ell\)——用于分析锦标赛赛程操纵问题 (TFP),证明 TFP 在以这两个参数为参数时均是 FPT 的,其中入度参数化的算法设计涉及复杂的结构分析和颜色编码技术。

How to Marginalize in Causal Structure Learning?

本文利用可处理概率电路(Probabilistic Circuits)替代传统动态规划方法来执行贝叶斯结构学习中的边际化任务,通过一种新颖的两阶段训练策略(先学习完整父集分数再渐进式微调边际查询),消除了候选父节点集数量的人为限制,从而在 TRUST 框架上取得了更好的后验分布估计效果。

How Wide and How Deep? Mitigating Over-Squashing of GNNs via Channel Capacity Constrained Estimation

本文从信息论视角出发,将谱图神经网络建模为通信信道,提出信道容量约束估计框架 C3E,将 GNN 隐藏维度与深度的选择形式化为一个非线性规划问题,在训练前即可估计最优架构参数,有效缓解信息过度压缩(over-squashing),在 9 个数据集上一致提升了表示学习效果。

HyperSHAP: Shapley Values and Interactions for Explaining Hyperparameter Optimization

HyperSHAP 提出一套基于 Shapley 值和 Shapley 交互的博弈论框架来解释超参数优化(HPO),通过定义消融、灵敏度、可调性和优化器偏差四类解释博弈,提供比 fANOVA 更具可操作性的超参数重要性分析。

I2E: Real-Time Image-to-Event Conversion for High-Performance Spiking Neural Networks

I2E 提出一个超高效的图像到事件流转换框架,通过模拟微扫视眼动并用高度并行化的卷积实现比先前方法快 300 倍以上的转换速度,首次支持 SNN 训练的在线数据增强,在 I2E-ImageNet 上达到 60.50% 的事件分类 SOTA,并通过合成数据预训练 + 真实数据微调的 sim-to-real 范式在 CIFAR10-DVS 上创下 92.5% 的历史最佳。

Improved Differentially Private Algorithms for Rank Aggregation

针对差分隐私下的排名聚合问题,提出了改进的近似算法:首次研究footrule排名聚合问题并给出近最优算法(可推导出Kemeny问题的2-近似),同时通过结合二路边际查询和无偏估计技术改进了Kemeny排名聚合的PTAS加性误差(指数从3降至65/22)。

Intermediate N-Gramming: Deterministic and Fast N-Grams For Large N and Large Datasets

提出 Intergrams 多遍扫描算法,利用较短 n-gram 作为前缀递推过滤候选更长 n-gram,充分利用处理器缓存层次结构实现缓存友好的内存访问模式,在 TB 级数据集上比此前最快的 hash-gramming 方法加速 6-33 倍,同时几乎精确恢复所有 top-k n-gram。

Intrinsic Barriers and Practical Pathways for Human-AI Alignment: An Agreement-Based Complexity Analysis

本文将 AI 对齐形式化为 \(\langle M,N,\varepsilon,\delta\rangle\)-agreement 多目标优化问题,从通信复杂度角度证明了对齐的信息论下界(编码"所有人类价值观"本质上不可行),同时给出了无界/有界理性智能体的显式可达算法和紧致上界,揭示了在大状态空间下 reward hacking 全局不可避免的理论根基。

Judging by the Rules: Compliance-Aligned Framework for Modern Slavery Statement Monitoring

提出以"合规对齐法官"(CA-Judge)为核心的训练框架,利用规则级对齐反馈训练 3B 参数的 CALLM 模型,使其生成基于法定条款的可追溯合规判断理由,在现代奴役声明的句子级合规分类任务上超越 GPT-4o 和 DeepSeek-R1。

LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval

提出 LeanRAG 框架,通过语义聚合算法在层次化知识图谱的摘要节点间自动构建显式关系打破"语义孤岛",并基于最近公共祖先(LCA)的自底向上检索策略高效导航层次结构,在四个 QA 基准上取得 SOTA 同时减少 46% 的检索冗余。

Learning Compact Latent Space for Representing Neural Signed Distance Functions with High-fidelity Geometry Details

提出一种双分支架构(泛化分支+过拟合分支)来学习多个神经SDF的紧凑潜空间,结合共享spatial feature grid和新颖的带宽采样策略,在保持紧凑latent code的同时恢复高保真几何细节,在Stanford Models、ShapeNet和D-FAUST上均达到SOTA。

Learning Fair Representations with Kolmogorov-Arnold Networks

提出将Kolmogorov-Arnold网络(KAN)引入对抗去偏框架,利用KAN的样条函数架构提供理论上的Lipschitz连续性和平滑性保证,并设计自适应 \(\lambda\) 更新机制动态平衡公平性与准确率,在UCI大学录取数据集上实现了公平性指标的显著提升。

Learning Network Dismantling Without Handcrafted Inputs

提出MIND(Message Iteration Network Dismantler),通过全新的All-to-One注意力机制和消息迭代轮廓(Message Iteration Profiles)消除GNN对手工特征的依赖,仅利用原始邻接信息就能在百万节点级真实网络上实现SOTA的网络拆解性能,同时具有最低的计算复杂度 \(O(|V|+|E|)\)

Life, Machine Learning, and the Search for Habitability: Predicting Biosignature Fluxes for the Habitable Worlds Observatory

本文为 NASA 宜居世界天文台(HWO)的系外行星观测优先级排序需求,提出贝叶斯卷积神经网络(BCNN)和新型光谱查询自适应 Transformer(SQuAT)两种架构,从行星反射光谱中预测生物标志物种类的通量,两者在增强数据集上均实现了高预测精度,且分别在不确定性量化和可解释性方面各有优势。

LILAD: Learning In-context Lyapunov-stable Adaptive Dynamics Models

提出 LILAD 框架,利用 GPT-2 的 in-context learning 能力同时学习动力学模型和 Lyapunov 函数,在保证全局指数稳定性的同时实现对非平稳参数化动力系统的自适应辨识,在多个基准系统上超越 ICL、MAML 等基线。

Local Guidance for Configuration-Based Multi-Agent Pathfinding

提出局部引导(Local Guidance)概念改进 LaCAM 的多智能体路径规划,通过在每个配置生成步为每个智能体构造局部时空路径来缓解拥塞,最高可将解的代价降低 50%,同时保持 1000 智能体下几秒内完成。

Lost in Time? A Meta-Learning Framework for Time-Shift-Tolerant Physiological Signal Transformation

提出 ShiftSyncNet,一个基于元学习双层优化的框架,通过 SyncNet 学习训练样本对之间的时间偏移量并利用傅里叶变换的相移性质自动校正标签对齐,在三个数据集上分别提升了 9.4%、6.0% 和 12.8% 的波形转换精度。

Measuring Model Performance in the Presence of an Intervention

针对存在干预(intervention)时 AI 模型评估偏差的问题,提出 Nuisance Parameter Weighting (NPW) 方法,通过对 RCT 治疗组数据进行因果加权,实现无偏的 AUROC 估计,使样本效率提升 5 倍,显著改善了模型选择和假设检验的统计功效。

MF-Speech: Achieving Fine-Grained and Compositional Control in Speech Generation via Factor Disentanglement

提出MF-Speech框架,通过多目标优化将语音信号解耦为高纯度的内容、音色和情绪三个独立因子表示,再利用动态融合和层级风格自适应归一化(HSAN)实现细粒度的组合式语音生成控制,在多因子组合语音生成任务上显著超越现有方法(WER=4.67%, SECS=0.5685)。

MindCross: Fast New Subject Adaptation with Limited Data for Cross-subject Video Reconstruction from Brain Signals

提出 MindCross,一个跨被试脑解码框架,通过共享编码器学习被试无关信息 + N个特有编码器学习被试相关信息,配合快速校准阶段和 Top-K 协作解码模块,仅用一个模型在 fMRI/EEG-to-video 基准上实现与被试独立模型可比的性能,且新被试适应仅需极少数据和极短时间(~1秒 vs 基线5-17秒)。

Model Change for Description Logic Concepts

本文研究描述逻辑概念在面对以 pointed interpretation 表示的新模型时的修改问题,定义了驱逐(eviction)、接纳(reception)和修正(revision)三种操作,并为 EL 和 ALC 描述逻辑提供了兼容性的正面和负面理论结果。

Model Counting for Dependency Quantified Boolean Formulas

本文首次研究了依赖量化布尔公式(DQBF)的模型计数问题,证明了即使仅含两个存在量词变量的 #2-DQBF 就已是 #EXP-完全的,并基于 BDD 符号可达性技术实现了一个实用的 2-DQBF 模型计数器 sharp2DQR,在大依赖集上显著优于基于展开的基线方法。

On the Edge of Core (Non-)Emptiness: An Automated Reasoning Approach to Approval-Based Multi-Winner Voting

针对基于认可的多赢者投票中核稳定性(core stability)是否总存在这一重大开放问题,提出基于混合整数线性规划(MILP)的自动推理框架,证明了新的存在性结果,发现了核稳定性与其他公理(如 Lindahl 可定价性)之间此前未知的关系,并推翻了一个已有猜想。

On the Information Processing of One-Dimensional Wasserstein Distances with Finite Samples

本文通过Poisson过程框架,解析刻画了一维Wasserstein距离在有限样本下同时编码概率密度函数的逐点密度差异(rate difference)和支撑差异(support difference)的能力,并在神经脉冲数据和氨基酸接触频率数据上验证了其实际价值。

On the Variability of Concept Activation Vectors

对 TCAV 方法中概念激活向量(CAV)的变异性进行首次理论分析,证明 CAV 的方差以 \(O(1/N)\) 速率衰减(\(N\) 为随机样本数),而 TCAV 分数的方差因"边界点"保持 \(O(1)\),需通过多次运行平均以 \(O(1/s)\) 降低。

Online Linear Regression with Paid Stochastic Features

研究了在线线性回归中特征被噪声污染、学习者可以付费降低噪声强度的新问题设定,证明了已知噪声协方差时最优遗憾率为 \(\widetilde{\mathcal{O}}(\sqrt{T})\)、未知时为 \(\widetilde{\mathcal{O}}(T^{2/3})\),并给出匹配的下界,所有界关于时间 \(T\) 的依赖都是阶最优的。

Optimal Welfare in Noncooperative Network Formation under Attack

在Goyal等人(WINE 2016)提出的非合作网络形成博弈模型中,证明了自私智能体创建的均衡网络在面对包括maximum disruption在内的广泛攻击者类别(超二次扰动攻击者SQD)时,仍能维持渐近最优的社会福利\(n^2 - O(n)\),解决了一个长期开放问题。

OR-R1: Automating Modeling and Solving of Operations Research Optimization Problems

OR-R1提出了一个数据高效的两阶段训练框架(SFT + TGRPO),仅使用ORLM所需1/10的合成数据即达到67.7%的平均求解准确率,超越现有SOTA方法,并通过测试时强化学习将单次生成(Pass@1)与多次生成(Pass@8)的性能差距从13%缩小到7%。

ParaMETA: Towards Learning Disentangled Paralinguistic Speaking Styles Representations

提出 ParaMETA,一种统一的副语言说话风格表示学习框架,通过 META 空间正则化和任务特定子空间投影实现情感、年龄、性别、语言等说话风格的解耦表示,同时支持下游的多任务分类和风格可控语音合成。

Parameterized Approximation Algorithms for TSP on Non-Metric Graphs

本文针对非度量图上的旅行商问题(TSP),提出了关于参数 \(p\)(违反三角不等式的顶点数)和 \(q\)(最小违反集大小)的改进FPT近似算法,将 \(p\) 参数下的近似比从2.5改进到1.5,\(q\) 参数下从11改进到3。

ParaRevSNN: A Parallel Reversible Spiking Neural Network for Efficient Training and Inference

提出ParaRevSNN,一种并行可逆脉冲神经网络架构,通过重新设计可逆块间的数据依赖关系解耦顺序计算约束,在保持可逆性(内存高效)的同时实现块间并行,训练时间减少最多35.2%,推理时间降至18.15%。

PIPHEN: Physical Interaction Prediction with Hamiltonian Energy Networks

提出PIPHEN分布式物理认知-控制框架,通过物理交互预测网络(PIPN)进行"语义蒸馏"将高维感知数据压缩至原始数据量的5%以下,再由基于哈密顿能量守恒的HEN控制器生成协调动作,从而解决多机器人系统的"共享大脑困境"。

Predict and Resist: Long-Term Accident Anticipation under Sensor Noise

提出统一框架,将基于扩散模型的双层去噪模块与时间感知的Actor-Critic强化学习模型结合,在传感器噪声条件下实现鲁棒的长期交通事故预测,在三个基准数据集上取得了准确率(AP)和平均事故前预警时间(mTTA)的最优性能。

Private Frequency Estimation via Residue Number Systems

提出 ModularSubsetSelection (MSS),一种基于剩余数系统(RNS)的本地差分隐私频率估计协议,在保持与 SubsetSelection 和 PGR 相当的估计精度的同时,显著降低通信开销(比 SS 减少达一半)、大幅加速服务器解码(比 PGR 快 11-448 倍)、并实现最低的数据重建攻击成功率。

Provably Data-Driven Projection Method for Quadratic Programming

将数据驱动的投影矩阵学习从线性规划(LP)扩展到凸二次规划(QP),通过提出"展开主动集方法"在 Goldberg-Jerrum 框架下建模 QP 最优值的计算过程,从而建立了投影矩阵学习的伪维度上界和泛化保证。

Radar-APLANC: Unsupervised Radar-based Heartbeat Sensing via Augmented Pseudo-Label and Noise Contrast

提出首个雷达心跳感知的无监督学习框架 Radar-APLANC,通过噪声对比三元组损失(NCT loss)和增强伪标签生成器实现两阶段无监督训练,无需昂贵的生理信号标注即可达到接近监督方法的性能。

RcAE: Recursive Reconstruction Framework for Unsupervised Industrial Anomaly Detection

提出递归卷积自编码器(RcAE),通过参数共享的多步迭代重建逐步抑制异常并保留正常细节,配合跨递归检测模块(CRD)利用多步重建动态实现鲁棒的异常定位,在仅需10%扩散模型参数的条件下达到可比的SOTA性能。

Reimagining Anomalies: What if Anomalies Were Normal?

提出首个面向无监督图像异常检测的反事实解释框架,通过训练生成器将异常样本修改为被检测器视为正常的多个解纠缠反事实,从语义层面回答“如果异常是正常的,它应该是什么样子?”,提供远超传统热力图的深层解释能力。

Rethinking Flow and Diffusion Bridge Models for Speech Enhancement

本文提出了一个统一的理论框架,将语音增强中的 flow matching、score-based diffusion 和 Schrödinger bridge 模型统一为在配对数据之间构造不同高斯概率路径的过程,并揭示了这类生成模型每一步采样本质上等价于预测式语音增强,进而利用预测范式中的高性能骨干网络、改进损失函数和微调策略来增强桥模型性能。

Reward Redistribution via Gaussian Process Likelihood Estimation

本文提出了基于高斯过程似然的奖励重分配框架 GP-LRR,通过核函数显式建模 state-action 对之间的相关性,利用 leave-one-out 策略最大化轨迹回报的边际似然来学习逐步奖励函数,理论证明传统 MSE 方法是其退化特例,并在 MuJoCo 基准上配合 SAC 实现了优越的样本效率和策略性能。

Scalable Vision-Guided Crop Yield Estimation

提出基于预测驱动推断(PPI++)的农作物产量估计方法,利用田间照片训练的视觉模型补充昂贵的实地测产数据,在保证无偏性的同时将有效样本量提升高达 73%,为区域农业保险提供更精确且低成本的产量估计。

Semi-Supervised High Dynamic Range Image Reconstructing via Bi-Level Uncertain Area Masking

提出半监督 HDR 重建框架,通过不确定性估计分支评估伪 HDR 标签质量,在 patch 和像素两个层面掩码不可靠区域,仅用 6.7% HDR 真值即可达到与全监督 SOTA 可比的性能。

ShortageSim: Simulating Drug Shortages under Information Asymmetry

提出 ShortageSim,首个基于 LLM 多智能体的药品短缺模拟框架,建模 FDA 监管者、制造商和购买者在信息不对称下的战略决策,在历史短缺数据上实现对解决滞后时间 84% 的预测改善,为监管策略评估提供受控测试平台。

Shrinking the Teacher: An Adaptive Teaching Paradigm for Asymmetric EEG-Vision Alignment

提出自适应教学范式(Adaptive Teaching Paradigm),通过无残差连接的瓶颈结构 ShrinkAdapter 让视觉"教师"主动收缩和调整其知识结构以适配 EEG"学生"的学习能力,在零样本脑-图像检索任务上 Top-1 准确率达到 60.2%,超越前 SOTA 9.8 个百分点。

Spike Imaging Velocimetry: Dense Motion Estimation of Fluids Using Spike Cameras

提出 Spike Imaging Velocimetry(SIV),首次将脉冲相机(20000Hz 超高时间分辨率)应用于流体测速,设计细节保持层次变换(DPHT)、图编码器(GE)和多尺度速度精炼(MSVR)三个针对流体特性的模块,并构建了 PSSD 数据集,在稳态湍流、高速流和 HDR 场景上全面超越现有基线。

STEM Faculty Perspectives on Generative AI in Higher Education

通过对美国一所大型公立大学 29 名 STEM 教师的焦点小组研究,揭示教师如何在教学中整合 GenAI、观察到的学生学习益处与挑战,以及所需的制度支持——发现 GenAI 将教师劳动从内容创建转向专家审核,且可能掩盖学生能力不足。

Structural Approach to Guiding a Present-Biased Agent

在Kleinberg-Oren模型的委托-代理扩展中,系统性地研究了T-path-Editing问题的参数化复杂性,给出了以树宽和路径代价多样性为参数的FPT算法,并建立了紧的困难性结果,全面刻画了引导当前偏差agent完成关键任务的可处理-不可处理边界。

Structure-Aware Encodings of Argumentation Properties for Clique-width

本文设计了从抽象论辩问题到(Q)SAT的有向分解引导(DDG)归约,线性保持团宽(clique-width),为所有常见论辩语义(stable、admissible、complete、preferred、semi-stable、stage)在扩展存在性、论元接受性和计数问题上建立了以团宽为参数的可处理性上界,并证明了在ETH假设下这些归约的开销不可显著改进。

SVD-NO: Learning PDE Solution Operators with SVD Integral Kernels

提出 SVD-NO,通过显式参数化积分核的奇异值分解(SVD)来构建神经算子,在保持高表达力的同时实现 \(O(ndL)\) 的线性计算复杂度,在 5 个 PDE 基准上达到新 SOTA。

Symbolic Planning and Multi-Agent Path Finding in Extremely Dense Environments with Unassigned Agents

提出 Block Rearrangement Problem (BRaP) 形式化定义,并设计五种基于配置空间搜索、PDDL 符号规划和 MAPF 的求解算法,其中 BR-LaCAM 在最大 80×80 的极端密集网格上达到 92% 成功率和毫秒级求解速度。

SynWeather: Weather Observation Data Synthesis across Multiple Regions and Variables via a General Diffusion Transformer

构建了首个支持统一多区域多变量的气象观测数据合成数据集SynWeather(覆盖4个区域×4种变量×6颗卫星),并提出基于Diffusion Transformer的通用概率生成模型SynWeatherDiff,通过文本提示引导在多个合成任务上超越专用模型和现有通用模型。

Tab-PET: Graph-Based Positional Encodings for Tabular Transformers

Tab-PET 提出从表格特征间关联关系中估计图结构,利用图拉普拉斯特征向量构造位置编码(PE)注入 Tabular Transformer,理论和实验均证明 PE 可降低嵌入的有效秩从而提升泛化,在 50 个数据集上为 TabTransformer / SAINT / FT-Transformer 带来一致改进,且 Spearman 关联图效果最佳。

TaylorPODA: A Taylor Expansion-Based Method to Improve Post-Hoc Attributions for Opaque Models

在Taylor展开框架下提出精确性(precision)、联合性(federation)、零偏差(zero-discrepancy)三个公设规范特征归因,并引入自适应属性(adaptation)通过AUP目标优化交互效应的分配权重,成为唯一同时满足所有公设和属性的事后模型无关归因方法。

TDSNNs: Competitive Topographic Deep Spiking Neural Networks for Visual Cortex Modeling

提出拓扑深度脉冲神经网络(TDSNNs),通过设计时空约束(STC)损失函数,在深层SNN中成功复现灵长类视觉皮层从V1到IT的层级拓扑组织,既保持了高任务性能(ImageNet top-1无精度下降),又显著超越现有拓扑ANN的脑相似性。

The Limitations and Power of NP-Oracle-Based Functional Synthesis Techniques

系统性地从理论层面研究了依赖NP预言机的函数综合方法的能力与局限,证明了朴素的逐位学习方法在多输出场景下必然失败、基于Resolution插值的方法会产生指数级电路,同时证明了NP预言机是高效综合的必要条件,并给出了利用NP预言机在多项式时间内综合小规模Skolem函数的正面结果。

The Publication Choice Problem

提出"出版选择问题"这一博弈论框架,建模研究者的出版策略与期刊影响力之间的双向互动关系,证明了纯策略均衡的存在性和唯一性,并分析了 Spotlight 论文标签对学术生态的影响。

Theoretical and Empirical Analysis of Lehmer Codes to Search Permutation Spaces with Evolutionary Algorithms

首次对 Lehmer 编码(逆序向量)在进化算法中搜索排列空间的效率进行严格的数学运行时分析,证明 Lehmer 编码的 EA 在多数基准函数上达到 \(O(n^2 \log n)\)\(O(n^2)\) 的期望运行时间,与经典表示持平或更优,并在 LOP 和 QAP 实际问题上验证其实用性。

ASAG: Toward the Frontiers of Reliable Diffusion Sampling via Adversarial Sinkhorn Attention Guidance

提出 ASAG(Adversarial Sinkhorn Attention Guidance),从最优传输理论角度重新解读扩散模型中的自注意力分数,通过 Sinkhorn 算法在注意力层中注入对抗性传输代价来故意降低 query-key 相似度,从而破坏误导性注意力对齐并提升条件/无条件采样质量,方法轻量、即插即用、无需重训练。

Towards Temporal Fusion Beyond the Field of View for Camera-based Semantic Scene Completion

提出 C3DFusion 模块,通过在 3D 空间中显式对齐历史帧和当前帧的点特征,首次系统解决相机基 SSC 中视野外(out-of-frame)区域的时序补全问题,在 SemanticKITTI 和 SSCBench-KITTI-360 上取得 SOTA。

Tractable Weighted First-Order Model Counting with Bounded Treewidth Binary Evidence

提出一种在域大小上多项式时间的算法,计算带有有界树宽二元证据的 \(\text{FO}^2\)\(\text{C}^2\) 片段的加权一阶模型计数(WFOMC),并解决了有界树宽有界度图上的稳定座位安排开放问题。

Variance Computation for Weighted Model Counting with Knowledge Compilation Approach

本文将加权模型计数 (WMC) 的权重视为具有方差的随机变量,提出在 structured d-DNNF 表示上多项式时间计算 WMC 方差的算法,同时证明了在 structured DNNF、d-DNNF 和 FBDD 上该问题不可解(除非 P=NP),并将其应用于贝叶斯网络推理中参数不确定性的量化。

Verification-Guided Context Optimization for Tool Calling via Hierarchical LLMs-as-editors

提出VGCO框架,利用LLM作为分层编辑器,通过验证引导的方式迭代优化工具文档和知识库上下文,显著提升大规模工具调用场景下的检索召回、工具选择和参数填充准确率。

Whispering Agents: An Event-Driven Covert Communication Protocol for the Internet of Agents

首次形式化定义了智能体互联网(IoA)中的"隐蔽事件通道"(Covert Event Channel),并设计了 ΠCCAP 协议,通过在智能体对话的存储、时序和行为维度中嵌入秘密数据,实现了高容量、高鲁棒性且对 LLM 审查员不可感知的隐蔽通信。

Why Isn't Relational Learning Taking Over the World?

本文是一篇 position paper,深入分析了关系学习(relational learning)未能在 AI 领域占据主导地位的原因——包括数据集不够真实、评估方法存在根本缺陷、缺少负例、聚合操作的理论困境等——并指出了让关系学习发挥应有潜力所需的关键改进方向。