Scientific Knowledge-Guided Machine Learning for Vessel Power Prediction: A Comparative Study¶
会议: AAAI 2026
arXiv: 2602.18403
作者: Orfeas Bourchas, George Papalambrou
代码: 无
领域: 科学ML / 航海工程
关键词: 船舶功率预测, 混合建模, 物理残差学习, PINN, XGBoost, 外推泛化
一句话总结¶
提出物理基线+数据驱动残差的混合建模框架,将海试功率曲线(螺旋桨定律 \(P=cV^n\))作为基线,用 XGBoost/NN/PINN 学习残差修正,在稀疏数据区域显著提升外推稳定性和物理一致性。
动机¶
- 排放法规趋严:IMO 对航运碳排放的约束日益严格,准确预测主机功率是燃油优化和合规的前提。
- 传统经验模型不足:海试曲线和静水阻力模型仅捕获速度-功率的立方关系,无法反映风浪、船体污损等复杂工况偏差。
- 纯数据驱动外推能力差:XGBoost、ANN 等模型在训练分布内精度高,但在高速或极端工况等稀疏区域预测往往违反螺旋桨定律、出现非单调或平坦曲线。
- PINN 训练困难:物理信息神经网络虽能引入物理约束,但在含噪实测数据上训练极其困难,难以捕获陡峭梯度和不连续性。
- 残差混合策略的启示:近年物理信息学习领域中 Stacked Residual 等策略表明,将复杂预测分解为物理基线+残差修正可大幅简化学习任务。
- 缺乏跨架构系统比较:已有工作未在统一框架下比较 XGBoost、NN、PINN 三类模型在引入物理基线前后的表现差异。
解决思路¶
本文目标:### 整体框架
将功率预测分解为两部分:
\[\hat{P}(\bar{X}) = P_{\text{sea trial}}(V, T) + f(\bar{X})\]
- 物理基线 \(P_{\text{sea trial}}(V, T)\):从海试获得的静水功率曲线,形式为 \(P = cV^n\),分别拟合压载(ballast)和满载(laden)工况,中间吃水通过线性插值计算:
$。
方法详解¶
整体框架¶
将功率预测分解为两部分:
\[\hat{P}(\bar{X}) = P_{\text{sea trial}}(V, T) + f(\bar{X})\]
- 物理基线 \(P_{\text{sea trial}}(V, T)\):从海试获得的静水功率曲线,形式为 \(P = cV^n\),分别拟合压载(ballast)和满载(laden)工况,中间吃水通过线性插值计算:
\[P_{\text{sea trial}}(V,T) = \left(1-\frac{T-T_b}{T_l-T_b}\right) P_b(V) + \frac{T-T_b}{T_l-T_b} P_l(V)\]
- 残差回归器 \(f(\bar{X})\):数据驱动模型仅学习实测功率与物理基线之间的差异(残差),输入包括风速分量 \(W_x, W_y\)、船体老化时间等基线未覆盖的因素。
三种回归器的混合配置¶
- Hybrid XGBoost:用 XGBoost 预测残差,超参通过 RandomizedSearchCV 优化(学习率、树深度、估计器数量、L1/L2 正则化)。
- Hybrid NN:简单全连接网络预测残差,用 Adam 训练 1000 epochs,超参通过 WandB Bayesian sweep 优化(学习率、层数、神经元数)。
- Hybrid PINN:在 NN 基础上增加物理损失项。总损失为:
\[\mathcal{L}_{\text{PINN}} = \mathcal{L}_{\text{data}} + \lambda \mathcal{L}_{P.\text{law}}\]
其中物理损失通过对速度求偏导实现螺旋桨定律约束:
\[\mathcal{L}_{P.\text{law}} = \sum_{i}\left(\frac{\partial f}{\partial V}\bigg|_{x_i} - \left[3cV_i^2 - \text{基线导数项}\right]\right)^2\]
\(\lambda=100\) 固定权重,所有导数通过 PyTorch autograd 计算。
输入特征¶
| 符号 | 描述 | 单位 |
|---|---|---|
| \(V\) | 船舶对水速度 (S.T.W.) | kn |
| \(T\) | 平均吃水 | m |
| Trim | 纵倾 | m |
| \(W_x, W_y\) | 真风速的 cos/sin 分量 | kn |
| \(t\) | 记录时间(UTC) | — |
实验¶
数据集¶
约 40,000 个数据点,来自真实船舶 5 个月的运营数据,按 80/10/10 划分训练/验证/测试集。
定量结果¶
主实验¶
| 指标 | XGBoost Baseline | XGBoost Hybrid | NN Baseline | NN Hybrid | PINN Baseline | PINN Hybrid |
|---|---|---|---|---|---|---|
| Train MAE [kW] | 114.2 | 143.3 | 181.0 | 235.3 | 147.0 | 214.7 |
| Train RMSE [kW] | 180.5 | 199.9 | 229.7 | 292.1 | 205.5 | 248.3 |
| Val MAE [kW] | 114.2 | 143.3 | 156.3 | 214.1 | 135.5 | 167.2 |
| Val RMSE [kW] | 180.5 | 199.9 | 212.9 | 272.4 | 204.2 | 219.5 |
| Test MAE [kW] | 122.2 | 148.8 | 162.7 | 219.3 | 144.3 | 171.2 |
| Test RMSE [kW] | 195.0 | 208.2 | 225.1 | 284.3 | 211.9 | 229.5 |
混合模型的全局误差略高于基线模型(差异在船舶最大功率的 1% 以内),但全局指标无法反映稀疏区域的外推行为。
超参对比¶
消融实验¶
| 超参数 | XGBoost Base | XGBoost Hybrid | NN Base | NN Hybrid | PINN Base | PINN Hybrid |
|---|---|---|---|---|---|---|
| 学习率 | 0.25 | 0.1 | 1e-4 | 3e-4 | 1e-4 | 3e-4 |
| 层/深度 | depth=10 | depth=10 | 6层 | 4层 | 8层 | 6层 |
| 神经元/估计器 | 40 | 500 | 256 | 64 | 256 | 256 |
| 正则化 | L1=1,L2=0 | L1=1,L2=100 | — | — | λ=100 | λ=100 |
外推定性分析¶
在 8–17 kn 速度范围、压载吃水、5 kn 风速条件下(风向 0°/90°/180°),对所有模型评估外推行为: - XGBoost Baseline:高速区频繁出现非单调或平坦的功率-速度曲线,违反物理预期。 - NN Baseline:高速区过估,对风向敏感性异常。 - PINN Baseline:受益于物理损失,但在稀疏区域仍有偏差。 - 所有 Hybrid 模型:功率-速度曲线平滑、单调递增,在训练包络之外保持物理一致性。
主要发现¶
- 混合框架的核心价值不在于降低全局误差指标,而在于正则化稀疏和外推区域的模型行为。
- Hybrid PINN 在所有架构中表现最佳,兼具竞争性精度和最强的物理一致性。
- 将 ML 任务限制在残差预测上,等效于一种强正则化:模型无需重新发现速度-功率的主导关系。
- 在天气航线规划和速度优化等实际应用中,决策往往发生在历史数据覆盖最薄弱的区域——正是混合模型优势最大的地方。
关键发现¶
- 主要组件/模块贡献了最关键的性能提升
亮点与洞察¶
- 简洁有效的分解思路:用海试曲线做物理基线 + ML 学残差,实现思路直观、工程实用性强。
- 跨架构统一验证:在 XGBoost/NN/PINN 三种截然不同的架构上均验证有效,说明框架的通用性。
- PINN 物理损失的推导:在混合框架下重新推导了 PINN 的物理约束(对残差函数的偏导),数学推导完整清晰。
- 关注外推而非拟合:不追求训练误差更低,而是关注模型在未见工况下的物理可信度,问题定位精准。
局限与展望¶
- 物理基线仅使用压载和满载两个吃水条件的线性插值,是对实际非线性吃水-功率关系的简化。
- \(\lambda=100\) 固定不变,未探索自适应权重调度策略对 PINN 训练的影响。
- 实验数据仅来自单艘船舶的 5 个月数据,泛化到不同船型和更长时间跨度有待验证。
- 未考虑船体污损随时间的累积效应建模(仅作为输入特征之一)。
- 混合模型依赖海试数据的可用性,而非所有船舶都有标准化海试结果。
- 未与更先进的时序模型(如 Transformer、Mamba)进行比较。
相关工作¶
- 经典 ML 预测:Gaussian Process、SVR (Bassam et al. 2023; Gkerekos et al. 2019),ANN/LSTM (Guo et al. 2023; Cai et al. 2024; Chen et al. 2024),XGBoost (Nguyen et al. 2023; Agand et al. 2023; Fan et al. 2024)。
- PINN 在船舶领域:Raissi et al. (2017) 提出 PINN 框架,Lang et al. (2024) 和 Bourchas & Papalambrou (2025) 将其用于船速/功率预测。
- 残差混合策略:Howard et al. (2023) 提出 Stacked Networks 改善 PINN 训练,Eshkofti & Barreau (2025) 提出 Vanishing Stacked-Residual PINN。
评分¶
- 新颖性: ⭐⭐⭐ 框架思路直观,核心贡献在于系统性比较而非方法创新
- 实验充分度: ⭐⭐⭐⭐ 三种架构 × 两种配置的全面对比,含定量和定性分析
- 写作质量: ⭐⭐⭐⭐ 问题动机清晰、数学推导完整、图表丰富
- 价值: ⭐⭐⭐⭐ 提供实用的船舶功率预测工具,对天气航线和能效规划有直接应用价值