Reconstructing the Local Density Field with Combined Convolutional and Point Cloud Architecture¶

会议: NeurIPS 2025 (ML4PS Workshop)
arXiv: 2510.08573
代码: 无
领域: 3D视觉 / 宇宙学
关键词: 暗物质密度场重建, U-Net, DeepSets, 点云, 特异速度

一句话总结¶

提出一种混合卷积（U-Net）与点云（DeepSets）的神经网络架构，用于从暗物质晕的视线方向特异速度重建局部暗物质密度场，在小尺度上显著优于纯卷积和线性重建方法。

研究背景与动机¶

核心矛盾¶

核心矛盾：领域现状：观测宇宙学的核心目标之一是推断局部宇宙中晚期物质密度场。暗物质不可见，需依赖间接探测手段，如星系特异速度。传统线性重建方法（如Wiener滤波）在大尺度上有效，但无法在非线性尺度上充分利用现代数据中的密集信息。纯卷积网络虽有改进，但将径向速度栅格化后传入CNN会损失小尺度信息。本文提出在高密度区域用DeepSets点云网络直接处理局部暗物质晕集合来恢复小尺度特征。

方法详解¶

整体框架¶

架构由三部分组成：(1) 置信度U-Net预测误差分布并选择需要DeepSets评估的体素；(2) DeepSets在选定的高不确定性体素上评估局部点云信息；(3) 主U-Net综合线性重建、DeepSets输出和置信度网络输出进行最终预测。

关键设计¶

输入预处理：不直接使用栅格化径向速度（卷积网络的翻译不变性归纳偏置与之不匹配），而是先用线性理论通过直接反演得到\(\delta_L(\mathbf{k})\)。使用三种不同平滑尺度（1, 2, 4 \(h^{-1}\)Mpc）作为独立输入通道，让网络学习最优加权
DeepSets点云模块：对每个体素，在10 \(h^{-1}\)Mpc半径内收集周围暗物质晕，使用相对位置和视线速度作为点级特征，全局位置和平均速度作为全局特征
置信度网络节省计算：评估128³个体素的DeepSets计算量过大，因此训练双头U-Net（预测均值\(\bar{\delta}\)和误差\(\sigma\)），仅对\(\sigma\)最高的5×10⁴个体素（约2.4%体积）评估DeepSets
输出变换：\(\hat{\delta} = \text{ReLU}(\sinh(y)) - 1\)，更好适配密度场的动态范围

损失函数 / 训练策略¶

置信度U-Net用\(\beta\)-NLL损失（\(\beta=0.5\)）训练
主模型用场级均方误差（MSE）优化
两阶段训练：先训练置信度U-Net，再训练包含DeepSets的完整模型
使用AdamW优化器和one-cycle学习率调度，24块NVIDIA A100 GPU训练约30小时

实验关键数据¶

主实验¶

模型	MSE
直接反演(1 h⁻¹Mpc平滑)	4.94
直接反演(4 h⁻¹Mpc平滑)	4.48
3D Wiener滤波	3.80
普通U-Net	3.20
置信度U-Net(μ预测)	3.26
U-Net + DeepSets(5万体素)	2.99

消融实验¶

DeepSets的改进主要出现在\(k \sim 0.1-0.2~h\text{Mpc}^{-1}\)以上的小尺度
置信度网络预测的\(\sigma\)与底层\(\delta\)的相关系数在\(k=1~h\text{Mpc}^{-1}\)以上大于0.8
置信度网络主要选出高密度区域进行DeepSets评估，物理上合理

关键发现¶

机器学习重建相比线性Wiener滤波有戏剧性改进
即使在中等示踪物密度下，点云网络恢复的额外小尺度信息也很显著
U-Net+DeepSets在交叉相关系数和传递函数上均优于纯U-Net
一些密度峰被置信度网络完全遗漏，说明仍有改进空间

亮点与洞察¶

创新架构设计：巧妙结合CNN的大尺度高效处理与点云网络的小尺度精细信息捕获
计算效率trick：置信度网络选择性评估仅2.4%体素，使得计算可行
物理驱动输入设计：使用线性重建\(\delta_L\)而非原始速度场作为输入，更好匹配CNN归纳偏置

局限与展望¶

仅在模拟数据上验证，未涉及观测数据中的系统效应
未包含随机性（生成式方法），仅回归均值
未排除示踪物密度场对预测的影响
需要已知且固定的背景宇宙学参数

评分¶

新颖性：⭐⭐⭐⭐（混合架构设计新颖）
技术深度：⭐⭐⭐⭐（计算效率优化出色）
实验完整性：⭐⭐⭐（workshop论文，实验适中）
实用价值：⭐⭐⭐（有应用前景但需进一步验证）
综合评价：⭐⭐⭐⭐（解决实际科学问题的创新架构）

补充分析¶

数据来源为 Quijote 高分辨率模拟的 100 个模拟盒（边长 1 \(h^{-1}\)Gpc），每个盒子随机选取一个暗物质晕作为观测者，收集 200 \(h^{-1}\)Mpc 半径内约 30,000 个暗物质晕。数据集大小 25,600，按 80/10/10 比例在模拟盒间划分训练/验证/测试集以防信息泄露。使用 \(128^3\) 的规则网格（体素间距约 3.23 \(h^{-1}\)Mpc）。

两点统计分析（Fig. 3）的关键发现：Wiener滤波基线实际上使用了完整的3D速度信息（而真实观测只有视线分量），因此是对线性重建的乐观估计。DeepSets改善在 \(k \sim 0.1-0.2 h\)Mpc\(^{-1}\) 以上的非线性尺度最为显著。置信度网络与密度场的相关系数在 \(k > 1 h\)Mpc\(^{-1}\) 时超过0.8，说明其智能地将计算资源分配给高密度区域是物理合理的。

输出变换 \(\hat{\delta} = \text{ReLU}(\sinh(y)) - 1\) 的设计考虑了密度场的特殊分布：大量接近1的值和少量极大值（高密度区域），sinh变换拉伸高密度端的动态范围。该架构可推广到宇宙学以外的其他空间场重建问题中。