⚛️ 物理/科学计算¶
🧪 ICML2025 · 20 篇论文解读
📌 同领域跨会议浏览: 📷 CVPR2026 (2) · 🔬 ICLR2026 (69) · 🧪 ICML2026 (33) · 🤖 AAAI2026 (15) · 🧠 NeurIPS2025 (57) · 📹 ICCV2025 (2)
🔥 高频主题: 少样本学习 ×2 · LLM ×2
- Causal-PIK: Causality-based Physical Reasoning with a Physics-Informed Kernel
-
提出 Causal-PIK,通过将物理因果相似性编码为贝叶斯优化的核函数(Physics-Informed Kernel),使智能体在物理推理任务中仅需极少次尝试即可找到最优动作,在 Virtual Tools 和 PHYRE 基准上超越 SOTA。
- Causal Discovery of Latent Variables in Galactic Archaeology
-
利用基于秩的潜变量因果发现算法(RLCD),仅从五个可观测恒星属性中,以纯数据驱动的方式自动恢复出两个物理上有意义的潜变量——出生半径和引导半径,验证了因果发现方法在天体物理学中发现隐藏物理量的潜力。
- Closed-form Symbolic Solutions: A New Perspective on Solving Partial Differential Equations
-
本文提出 SymPDE 框架,利用深度强化学习直接搜索 PDE 的闭式符号解,绕过了 PINNs 数值解精度不足和可解释性差的问题,在 Poisson 方程和热方程上达到 90% 的恢复率。
- Compact Matrix Quantum Group Equivariant Neural Networks
-
本文将群等变神经网络扩展到紧致矩阵量子群的设定下,利用 Woronowicz 形式的 Tannaka-Krein 对偶理论刻画了该类网络的权重矩阵,为非交换几何上的数据学习提供了理论基础。
- Differentiable Stellar Atmospheres with Physics-Informed Neural Networks
-
提出 Kurucz-a1,一个物理约束神经网络(PINN),用于模拟一维恒星大气模型(LTE 假设),解决了可微恒星光谱学中大气结构求解器不可微的关键瓶颈,在流体静力平衡和太阳光谱一致性上甚至优于经典 ATLAS-12 代码。
- Erwin: A Tree-based Hierarchical Transformer for Large-scale Physical Systems
-
提出 Erwin,一种基于 ball tree 分层结构的 Transformer 架构,通过将注意力计算限制在固定大小的局部球区域内,实现线性时间复杂度,同时通过渐进式粗化/细化和跨球交互机制捕获多尺度特征,在宇宙学、分子动力学、PDE 求解和粒子流体动力学多个领域达到 SOTA。
- Finetuning Stellar Spectra Foundation Models with LoRA
-
首次将 LoRA 应用于恒星光谱基础模型 SpecCLIP,实现以约 100-200 个标注样本将预训练在 LAMOST/Gaia XP 上的模型高效适配到 DESI 巡天数据,证明 LoRA 是跨光谱巡天迁移的轻量而有效策略。
- Gravity-Bench-v1: A Benchmark on Gravitational Physics Discovery for Agents
-
提出 Gravity-Bench-v1,一个基于引力动力学模拟的环境交互式基准测试,评估 AI Agent 在受限观测预算下进行科学发现(包括 OOD 物理场景)的能力,发现当前模型在观测规划和预算利用方面存在显著不足。
- Improving Memory Efficiency for Training KANs via Meta Learning
-
提出 MetaKANs,用一个小型元学习器(meta-learner)生成 KAN 中所有可学习激活函数的参数,将可训练参数量从 KAN 的 \((G+k+1)\) 倍压缩到接近 MLP 水平(约 1/3 到 1/9),同时保持甚至提升性能。
- L2D: Large Language Models to Diffusion Finetuning
-
提出L2D微调方法,将预训练LLM视为单步扩散模型,引入并行扩散路径实现多步推理缩放,不修改原始权重即可随推理步数增加获得单调递增的准确率,在4个LLM上的数学/编码/推理任务上取得一致提升。
- Liger: Linearizing Large Language Models to Gated Recurrent Structures
-
Liger 将预训练 Transformer LLM 无额外参数地转换为门控线性循环结构,利用 Key 投影矩阵复用构建门控机制,仅需 0.02% 预训练 token 即可恢复原模型 93% 的性能,同时获得线性时间推理和恒定显存开销。
- Maximal Update Parametrization and Zero-Shot Hyperparameter Transfer for Fourier Neural Operators
-
首次为 Fourier Neural Operator (FNO) 推导了 Maximal Update Parametrization (μP),使得在小模型上调优的超参数可以零样本迁移到十亿参数级 FNO,将 Navier-Stokes 问题的调参计算量降至 0.30×。
- Mixture-of-Expert Variational Autoencoders for Cross-Modality Embedding of Type Ia Supernova Data
-
提出基于 Perceiver-IO 架构的多模态混合专家 VAE(MMVAE),对 Ia 型超新星的光变曲线和光谱进行联合嵌入,实现从光变曲线到光谱的跨模态概率生成,重建精度优于对比学习基线。
- OmniArch: Building Foundation Model For Scientific Computing
-
OmniArch 是首个在 1D-2D-3D PDE 上进行统一预训练的科学计算基础模型,通过 Fourier 编解码器解决多尺度问题、Temporal Mask 机制处理多物理量耦合、PDE-Aligner 实现物理先验对齐,在 PDEBench 的 11 类 PDE 上达到了 SOTA 性能。
- PAC Learning with Improvements
-
提出"带改进的 PAC 学习"框架:当 agent 能真正提升自身特征至多 \(r\) 时,保守分类器可实现零误差(将标准 PAC 中不可能的目标变为可能),有限 VC 维既非充分也非必要条件,改进学习与标准 PAC 和策略性分类存在本质分离。
- Rethink the Role of Deep Learning towards Large-scale Quantum Systems
-
在统一量子资源约束下系统性地对比 ML 与 DL 在量子系统学习 (QSL) 任务中的表现,发现传统 ML(Lasso/Ridge/核方法)往往匹配甚至超越 DL,挑战了"大规模量子系统必须用深度学习"的直觉。
- Sum-of-Parts: Self-Attributing Neural Networks with End-to-End Learning of Feature Groups
-
SOP 提出了一种将任意可微分模型转换为基于分组的自归因神经网络(SANN)的框架,通过端到端学习特征分组实现了在 SANN 中的 SOTA 性能,并从理论上证明了逐特征 SANN 的误差下界和分组 SANN 的零误差可达性。
- Teaching LLMs to Speak Spectroscopy
-
仅使用 16 GPU 小时和 0.04% 的参数适配,通过 LoRA 将 LLaMA-3.1-8B 改造为可从光谱数据预测星系红移的模型,同时保留 85%+ 的语言能力,证明通用 LLM 可高效适配非文本科学模态。
- The Dark Side of the Forces: Assessing Non-Conservative Force Models for Atomistic Machine Learning
-
系统评估非保守力(直接预测而非从势能求导)机器学习原子间势在几何优化和分子动力学中的灾难性后果,并提出保守+非保守混合模型通过多时间步方案兼顾效率与物理正确性。
- Universal Neural Optimal Transport
-
提出 UNOT(Universal Neural Optimal Transport),利用 Fourier Neural Operator 学习跨数据集、跨分辨率的熵正则化最优传输对偶势函数,实现对 Sinkhorn 算法最高 7.4× 的加速初始化。