跳转至

AS-Bridge: A Bidirectional Generative Framework Bridging Next-Generation Astronomical Surveys

会议: CVPR 2026
arXiv: 2603.11928
代码: github.com/ZHANG7DC/AS-Bridge
领域: 天文图像 / 生成模型 / 跨域翻译
关键词: 天文巡天, Brownian Bridge, 双向图像翻译, 稀有事件检测, 概率重建

一句话总结

提出 AS-Bridge,基于双向 Brownian Bridge 扩散过程建模地面 LSST 与空间 Euclid 巡天观测间的条件概率分布,实现跨巡天概率图像翻译和利用重建不一致性的无监督强引力透镜检测。

研究背景与动机

领域现状:下一世代天文观测由 LSST(地面,6 光学波段,~0.7" 分辨率,受大气影响)和 Euclid(空间,高分辨率近红外,VIS 像素 0.1")主导,重叠天区约 7000–9000 平方度。

现有痛点:PSF、波段、噪声统计的系统性分布偏移使跨巡天联合分析困难。单一确定性映射无法捕捉固有的模糊性——LSST→Euclid 需从大气模糊中恢复精细形态(不适定),Euclid→LSST 需从少波段推断多波段色彩(不可辨识)。

核心矛盾:两个巡天对同一天体的观测是共享潜在天体物理过程 \(\Phi\) 的两个随机实现 \(x = \mathcal{O}(\Phi) + \epsilon(\mathcal{O}(\Phi))\)\(\Phi\) 不可直接观测,需边缘化后学习条件分布 \(p(x_{Euclid}|x_{LSST})\) 和反向。

切入角度:Brownian Bridge 在两个端点间定义随机插值过程,天然适合建模两个观测域间的概率关系。

核心 idea:用双向 Brownian Bridge 扩散过程建模巡天间的条件分布,并利用对 OOD 稀有天体重建失败来实现无监督异常检测。

方法详解

整体框架

在 LSST-Euclid 重叠天区提取配对图像 → 将跨巡天翻译建模为双向 Brownian Bridge 过程 → 共享一个扩散模型,通过选择桥的起点/终点实现双向推断 → 对常规天体忠实重建,对稀有天体(强引力透镜)重建失败 → 多次采样重建的不一致性作为异常分数。

关键设计

  1. Brownian Bridge 扩散过程

    • 功能:在两个巡天观测域之间建立随机路径,替代标准扩散的"数据→纯噪声"路径
    • 核心思路:给定端点 \((x_0, x_T)\),中间状态 \(x_t | (x_0, x_T) \sim \mathcal{N}((1-m_t)x_0 + m_t x_T, \delta_t I)\),其中 \(m_t = t/T\)\(\delta_t = m_t(1-m_t)\)。反向转移通过贝叶斯定理推导,保留源-目标的条件依赖关系
    • 设计动机:标准条件扩散(如 Palette)从纯噪声出发,源图像仅作为外部条件信号;BB 直接在两域间插值,避免经过高噪声状态,采样效率更高且更好地保持条件分布
  2. \(\epsilon\)-prediction 最大似然训练

    • 功能:证明 \(\epsilon\)-prediction 损失是 BB 标准损失乘以温和权重 \(\sqrt{\delta_t}\) 的等价形式
    • 核心思路:在方差爆炸扩散下,似然目标要求时间步权重 \(\delta_t\),但 BB 中 \(\delta_t\) 在端点处趋零导致梯度消失。\(\epsilon\)-prediction 损失 \(\|\epsilon_\theta - \epsilon\|_2^2\) 等价于权重 \(\sqrt{\delta_t}\) 的得分匹配,既保留似然导向的高噪声时间步强调又维持端点处梯度稳定
    • 设计动机:直接用 \(\delta_t\) 权重在 BB 训练中端点梯度消失,\(\epsilon\)-prediction 提供温和的中间方案
  3. 多采样异常检测

    • 功能:利用模型对分布外天体重建失败来发现稀有事件,无需异常标签
    • 核心思路:对配对观测 \((x_{Euclid}, x_{LSST})\) 通过前向过程融合后多次随机重建,像素级异常图取多次重建的逐像素最小误差 \(\mathcal{A}(p) = \min_i \|\hat{x}_0^{(i)}(p) - x_0(p)\|_2^2\),图像级分数按通量归一化消除亮度偏差
    • 设计动机:天文图像低信噪比导致单次重建误差被噪声主导;多次采样取最小值抑制噪声波动,保留系统性重建失败信号

损失函数 / 训练策略

训练损失为 \(\epsilon\)-prediction MSE。数据基于 SLSim 模拟的 115K 常规星系 + 5K 强引力透镜配对图像(64×64),Euclid VIS 单波段 + LSST gri 三波段。

实验关键数据

主实验

方向/任务 指标 AS-Bridge Palette SPADE pix2pix Joint Diffusion
LSST→Euclid CRPS↓ 2.38 2.43 3.39 4.35 3.14
Euclid→LSST CRPS↓ 7.90 7.98 16.52 73.03 15.15
异常检测方法 FPR@1%TPR↓ FPR@5%TPR↓ AUPR↑
AS-Bridge 0.00% 0.18% 0.80
CFM(跨模态) 0.24% 1.20% 0.75
Deco-Diff(单模态) 1.10% 5.00% 0.61

消融实验

训练目标 LSST→Euclid CRPS↓ Euclid→LSST CRPS↓
\(\epsilon\)-prediction(本文) 2.38 7.90
标准 BB loss 2.55 8.12
\(\delta_t\)-weighted loss 2.51 8.30

关键发现

  • 扩散/桥方法在概率重建上一致优于 GAN——GAN 倾向模式坍缩,不适合天文概率推断
  • Euclid→LSST CRPS 约为反方向 3.3 倍——从单宽波段推断多波段色彩本质上更难
  • 单模态异常检测(Deco-Diff)完全失败,跨模态信息对稀有事件检测至关重要
  • 多次随机重建取最小误差有效抑制低信噪比天文图像的噪声主导问题

亮点与洞察

  • 将天文巡天联合分析形式化为概率图像翻译问题,理论上优雅地处理跨域映射不确定性——方法论可推广到任何多传感器遥感场景
  • 稀有事件检测完全无监督——利用模型对分布外样本的系统性重建失败,无需异常标签。提出"发现导向"评估指标(FPR@lowTPR、AUPR)替代工业异常检测的高召回指标
  • \(\epsilon\)-prediction 等价性证明将 BB 训练与最大似然原则桥接,仅 3 行证明即完成

局限与展望

  • 完全基于模拟数据(SLSim),simulation-to-reality gap 不可避免——需在真实 LSST/Euclid 数据发布后重新验证
  • 64×64 分辨率对实际科学分析过低,需扩展到更高分辨率
  • 仅考虑 LSST(gri) 和 Euclid(VIS) 子集波段,全波段联合建模未探索
  • 异常检测仅验证强引力透镜一种类型,其他稀有天文事件泛化性未知

相关工作与启发

  • vs Palette: 条件扩散从纯噪声出发,BB 在源目标间直接建立随机路径,采样效率更高
  • vs BBDM: 共享 BB 框架,本文新增 \(\epsilon\)-prediction 理论改进和天文科学应用验证
  • vs CFM: 跨模态特征映射依赖显式特征融合模块,AS-Bridge 通过生成式重建隐式融合

评分

  • 新颖性: ⭐⭐⭐⭐ 巡天概率翻译 + 重建异常检测组合有创意
  • 实验充分度: ⭐⭐⭐ 模拟验证充分但缺乏真实数据
  • 写作质量: ⭐⭐⭐⭐ 问题形式化清晰,天体物理背景扎实
  • 实用价值: ⭐⭐⭐⭐ LSST/Euclid 数据可用后有直接应用潜力