⚛️ 物理/科学计算¶

🧪 ICML2025 · 20 篇论文解读

📌 同领域跨会议浏览： 📷 CVPR2026 (2) · 🔬 ICLR2026 (69) · 🧪 ICML2026 (33) · 🤖 AAAI2026 (15) · 🧠 NeurIPS2025 (57) · 📹 ICCV2025 (2)

🔥 高频主题： 少样本学习 ×2 · LLM ×2

Causal-PIK: Causality-based Physical Reasoning with a Physics-Informed Kernel: 提出 Causal-PIK，通过将物理因果相似性编码为贝叶斯优化的核函数（Physics-Informed Kernel），使智能体在物理推理任务中仅需极少次尝试即可找到最优动作，在 Virtual Tools 和 PHYRE 基准上超越 SOTA。
Causal Discovery of Latent Variables in Galactic Archaeology: 利用基于秩的潜变量因果发现算法（RLCD），仅从五个可观测恒星属性中，以纯数据驱动的方式自动恢复出两个物理上有意义的潜变量——出生半径和引导半径，验证了因果发现方法在天体物理学中发现隐藏物理量的潜力。
Closed-form Symbolic Solutions: A New Perspective on Solving Partial Differential Equations: 本文提出 SymPDE 框架，利用深度强化学习直接搜索 PDE 的闭式符号解，绕过了 PINNs 数值解精度不足和可解释性差的问题，在 Poisson 方程和热方程上达到 90% 的恢复率。
Compact Matrix Quantum Group Equivariant Neural Networks: 本文将群等变神经网络扩展到紧致矩阵量子群的设定下，利用 Woronowicz 形式的 Tannaka-Krein 对偶理论刻画了该类网络的权重矩阵，为非交换几何上的数据学习提供了理论基础。
Differentiable Stellar Atmospheres with Physics-Informed Neural Networks: 提出 Kurucz-a1，一个物理约束神经网络（PINN），用于模拟一维恒星大气模型（LTE 假设），解决了可微恒星光谱学中大气结构求解器不可微的关键瓶颈，在流体静力平衡和太阳光谱一致性上甚至优于经典 ATLAS-12 代码。
Erwin: A Tree-based Hierarchical Transformer for Large-scale Physical Systems: 提出 Erwin，一种基于 ball tree 分层结构的 Transformer 架构，通过将注意力计算限制在固定大小的局部球区域内，实现线性时间复杂度，同时通过渐进式粗化/细化和跨球交互机制捕获多尺度特征，在宇宙学、分子动力学、PDE 求解和粒子流体动力学多个领域达到 SOTA。
Finetuning Stellar Spectra Foundation Models with LoRA: 首次将 LoRA 应用于恒星光谱基础模型 SpecCLIP，实现以约 100-200 个标注样本将预训练在 LAMOST/Gaia XP 上的模型高效适配到 DESI 巡天数据，证明 LoRA 是跨光谱巡天迁移的轻量而有效策略。
Gravity-Bench-v1: A Benchmark on Gravitational Physics Discovery for Agents: 提出 Gravity-Bench-v1，一个基于引力动力学模拟的环境交互式基准测试，评估 AI Agent 在受限观测预算下进行科学发现（包括 OOD 物理场景）的能力，发现当前模型在观测规划和预算利用方面存在显著不足。
Improving Memory Efficiency for Training KANs via Meta Learning: 提出 MetaKANs，用一个小型元学习器（meta-learner）生成 KAN 中所有可学习激活函数的参数，将可训练参数量从 KAN 的 \((G+k+1)\) 倍压缩到接近 MLP 水平（约 1/3 到 1/9），同时保持甚至提升性能。
L2D: Large Language Models to Diffusion Finetuning: 提出L2D微调方法，将预训练LLM视为单步扩散模型，引入并行扩散路径实现多步推理缩放，不修改原始权重即可随推理步数增加获得单调递增的准确率，在4个LLM上的数学/编码/推理任务上取得一致提升。
Liger: Linearizing Large Language Models to Gated Recurrent Structures: Liger 将预训练 Transformer LLM 无额外参数地转换为门控线性循环结构，利用 Key 投影矩阵复用构建门控机制，仅需 0.02% 预训练 token 即可恢复原模型 93% 的性能，同时获得线性时间推理和恒定显存开销。
Maximal Update Parametrization and Zero-Shot Hyperparameter Transfer for Fourier Neural Operators: 首次为 Fourier Neural Operator (FNO) 推导了 Maximal Update Parametrization (μP)，使得在小模型上调优的超参数可以零样本迁移到十亿参数级 FNO，将 Navier-Stokes 问题的调参计算量降至 0.30×。
Mixture-of-Expert Variational Autoencoders for Cross-Modality Embedding of Type Ia Supernova Data: 提出基于 Perceiver-IO 架构的多模态混合专家 VAE（MMVAE），对 Ia 型超新星的光变曲线和光谱进行联合嵌入，实现从光变曲线到光谱的跨模态概率生成，重建精度优于对比学习基线。
OmniArch: Building Foundation Model For Scientific Computing: OmniArch 是首个在 1D-2D-3D PDE 上进行统一预训练的科学计算基础模型，通过 Fourier 编解码器解决多尺度问题、Temporal Mask 机制处理多物理量耦合、PDE-Aligner 实现物理先验对齐，在 PDEBench 的 11 类 PDE 上达到了 SOTA 性能。
PAC Learning with Improvements: 提出"带改进的 PAC 学习"框架：当 agent 能真正提升自身特征至多 \(r\) 时，保守分类器可实现零误差（将标准 PAC 中不可能的目标变为可能），有限 VC 维既非充分也非必要条件，改进学习与标准 PAC 和策略性分类存在本质分离。
Rethink the Role of Deep Learning towards Large-scale Quantum Systems: 在统一量子资源约束下系统性地对比 ML 与 DL 在量子系统学习 (QSL) 任务中的表现，发现传统 ML（Lasso/Ridge/核方法）往往匹配甚至超越 DL，挑战了"大规模量子系统必须用深度学习"的直觉。
Sum-of-Parts: Self-Attributing Neural Networks with End-to-End Learning of Feature Groups: SOP 提出了一种将任意可微分模型转换为基于分组的自归因神经网络（SANN）的框架，通过端到端学习特征分组实现了在 SANN 中的 SOTA 性能，并从理论上证明了逐特征 SANN 的误差下界和分组 SANN 的零误差可达性。
Teaching LLMs to Speak Spectroscopy: 仅使用 16 GPU 小时和 0.04% 的参数适配，通过 LoRA 将 LLaMA-3.1-8B 改造为可从光谱数据预测星系红移的模型，同时保留 85%+ 的语言能力，证明通用 LLM 可高效适配非文本科学模态。
The Dark Side of the Forces: Assessing Non-Conservative Force Models for Atomistic Machine Learning: 系统评估非保守力（直接预测而非从势能求导）机器学习原子间势在几何优化和分子动力学中的灾难性后果，并提出保守+非保守混合模型通过多时间步方案兼顾效率与物理正确性。
Universal Neural Optimal Transport: 提出 UNOT（Universal Neural Optimal Transport），利用 Fourier Neural Operator 学习跨数据集、跨分辨率的熵正则化最优传输对偶势函数，实现对 Sinkhorn 算法最高 7.4× 的加速初始化。