跳转至

Scientific Knowledge-Guided Machine Learning for Vessel Power Prediction: A Comparative Study

会议: AAAI 2026
arXiv: 2602.18403
作者: Orfeas Bourchas, George Papalambrou 代码: 无
领域: 科学ML / 航海工程
关键词: 船舶功率预测, 混合建模, 物理残差学习, PINN, XGBoost, 外推泛化

一句话总结

提出物理基线+数据驱动残差的混合建模框架,将海试功率曲线(螺旋桨定律 \(P=cV^n\))作为基线,用 XGBoost/NN/PINN 学习残差修正,在稀疏数据区域显著提升外推稳定性和物理一致性。

动机

  1. 排放法规趋严:IMO 对航运碳排放的约束日益严格,准确预测主机功率是燃油优化和合规的前提。
  2. 传统经验模型不足:海试曲线和静水阻力模型仅捕获速度-功率的立方关系,无法反映风浪、船体污损等复杂工况偏差。
  3. 纯数据驱动外推能力差:XGBoost、ANN 等模型在训练分布内精度高,但在高速或极端工况等稀疏区域预测往往违反螺旋桨定律、出现非单调或平坦曲线。
  4. PINN 训练困难:物理信息神经网络虽能引入物理约束,但在含噪实测数据上训练极其困难,难以捕获陡峭梯度和不连续性。
  5. 残差混合策略的启示:近年物理信息学习领域中 Stacked Residual 等策略表明,将复杂预测分解为物理基线+残差修正可大幅简化学习任务。
  6. 缺乏跨架构系统比较:已有工作未在统一框架下比较 XGBoost、NN、PINN 三类模型在引入物理基线前后的表现差异。

解决思路

本文目标:### 整体框架

将功率预测分解为两部分:

\[\hat{P}(\bar{X}) = P_{\text{sea trial}}(V, T) + f(\bar{X})\]
  • 物理基线 \(P_{\text{sea trial}}(V, T)\):从海试获得的静水功率曲线,形式为 \(P = cV^n\),分别拟合压载(ballast)和满载(laden)工况,中间吃水通过线性插值计算:

$。

方法详解

整体框架

将功率预测分解为两部分:

\[\hat{P}(\bar{X}) = P_{\text{sea trial}}(V, T) + f(\bar{X})\]
  • 物理基线 \(P_{\text{sea trial}}(V, T)\):从海试获得的静水功率曲线,形式为 \(P = cV^n\),分别拟合压载(ballast)和满载(laden)工况,中间吃水通过线性插值计算:
\[P_{\text{sea trial}}(V,T) = \left(1-\frac{T-T_b}{T_l-T_b}\right) P_b(V) + \frac{T-T_b}{T_l-T_b} P_l(V)\]
  • 残差回归器 \(f(\bar{X})\):数据驱动模型仅学习实测功率与物理基线之间的差异(残差),输入包括风速分量 \(W_x, W_y\)、船体老化时间等基线未覆盖的因素。

三种回归器的混合配置

  1. Hybrid XGBoost:用 XGBoost 预测残差,超参通过 RandomizedSearchCV 优化(学习率、树深度、估计器数量、L1/L2 正则化)。
  2. Hybrid NN:简单全连接网络预测残差,用 Adam 训练 1000 epochs,超参通过 WandB Bayesian sweep 优化(学习率、层数、神经元数)。
  3. Hybrid PINN:在 NN 基础上增加物理损失项。总损失为:
\[\mathcal{L}_{\text{PINN}} = \mathcal{L}_{\text{data}} + \lambda \mathcal{L}_{P.\text{law}}\]

其中物理损失通过对速度求偏导实现螺旋桨定律约束:

\[\mathcal{L}_{P.\text{law}} = \sum_{i}\left(\frac{\partial f}{\partial V}\bigg|_{x_i} - \left[3cV_i^2 - \text{基线导数项}\right]\right)^2\]

\(\lambda=100\) 固定权重,所有导数通过 PyTorch autograd 计算。

输入特征

符号 描述 单位
\(V\) 船舶对水速度 (S.T.W.) kn
\(T\) 平均吃水 m
Trim 纵倾 m
\(W_x, W_y\) 真风速的 cos/sin 分量 kn
\(t\) 记录时间(UTC)

实验

数据集

约 40,000 个数据点,来自真实船舶 5 个月的运营数据,按 80/10/10 划分训练/验证/测试集。

定量结果

主实验

指标 XGBoost Baseline XGBoost Hybrid NN Baseline NN Hybrid PINN Baseline PINN Hybrid
Train MAE [kW] 114.2 143.3 181.0 235.3 147.0 214.7
Train RMSE [kW] 180.5 199.9 229.7 292.1 205.5 248.3
Val MAE [kW] 114.2 143.3 156.3 214.1 135.5 167.2
Val RMSE [kW] 180.5 199.9 212.9 272.4 204.2 219.5
Test MAE [kW] 122.2 148.8 162.7 219.3 144.3 171.2
Test RMSE [kW] 195.0 208.2 225.1 284.3 211.9 229.5

混合模型的全局误差略高于基线模型(差异在船舶最大功率的 1% 以内),但全局指标无法反映稀疏区域的外推行为。

超参对比

消融实验

超参数 XGBoost Base XGBoost Hybrid NN Base NN Hybrid PINN Base PINN Hybrid
学习率 0.25 0.1 1e-4 3e-4 1e-4 3e-4
层/深度 depth=10 depth=10 6层 4层 8层 6层
神经元/估计器 40 500 256 64 256 256
正则化 L1=1,L2=0 L1=1,L2=100 λ=100 λ=100

外推定性分析

在 8–17 kn 速度范围、压载吃水、5 kn 风速条件下(风向 0°/90°/180°),对所有模型评估外推行为: - XGBoost Baseline:高速区频繁出现非单调或平坦的功率-速度曲线,违反物理预期。 - NN Baseline:高速区过估,对风向敏感性异常。 - PINN Baseline:受益于物理损失,但在稀疏区域仍有偏差。 - 所有 Hybrid 模型:功率-速度曲线平滑、单调递增,在训练包络之外保持物理一致性。

主要发现

  • 混合框架的核心价值不在于降低全局误差指标,而在于正则化稀疏和外推区域的模型行为
  • Hybrid PINN 在所有架构中表现最佳,兼具竞争性精度和最强的物理一致性。
  • 将 ML 任务限制在残差预测上,等效于一种强正则化:模型无需重新发现速度-功率的主导关系。
  • 在天气航线规划和速度优化等实际应用中,决策往往发生在历史数据覆盖最薄弱的区域——正是混合模型优势最大的地方。

关键发现

  • 主要组件/模块贡献了最关键的性能提升

亮点与洞察

  • 简洁有效的分解思路:用海试曲线做物理基线 + ML 学残差,实现思路直观、工程实用性强。
  • 跨架构统一验证:在 XGBoost/NN/PINN 三种截然不同的架构上均验证有效,说明框架的通用性。
  • PINN 物理损失的推导:在混合框架下重新推导了 PINN 的物理约束(对残差函数的偏导),数学推导完整清晰。
  • 关注外推而非拟合:不追求训练误差更低,而是关注模型在未见工况下的物理可信度,问题定位精准。

局限与展望

  • 物理基线仅使用压载和满载两个吃水条件的线性插值,是对实际非线性吃水-功率关系的简化。
  • \(\lambda=100\) 固定不变,未探索自适应权重调度策略对 PINN 训练的影响。
  • 实验数据仅来自单艘船舶的 5 个月数据,泛化到不同船型和更长时间跨度有待验证。
  • 未考虑船体污损随时间的累积效应建模(仅作为输入特征之一)。
  • 混合模型依赖海试数据的可用性,而非所有船舶都有标准化海试结果。
  • 未与更先进的时序模型(如 Transformer、Mamba)进行比较。

相关工作

  • 经典 ML 预测:Gaussian Process、SVR (Bassam et al. 2023; Gkerekos et al. 2019),ANN/LSTM (Guo et al. 2023; Cai et al. 2024; Chen et al. 2024),XGBoost (Nguyen et al. 2023; Agand et al. 2023; Fan et al. 2024)。
  • PINN 在船舶领域:Raissi et al. (2017) 提出 PINN 框架,Lang et al. (2024) 和 Bourchas & Papalambrou (2025) 将其用于船速/功率预测。
  • 残差混合策略:Howard et al. (2023) 提出 Stacked Networks 改善 PINN 训练,Eshkofti & Barreau (2025) 提出 Vanishing Stacked-Residual PINN。

评分

  • 新颖性: ⭐⭐⭐ 框架思路直观,核心贡献在于系统性比较而非方法创新
  • 实验充分度: ⭐⭐⭐⭐ 三种架构 × 两种配置的全面对比,含定量和定性分析
  • 写作质量: ⭐⭐⭐⭐ 问题动机清晰、数学推导完整、图表丰富
  • 价值: ⭐⭐⭐⭐ 提供实用的船舶功率预测工具,对天气航线和能效规划有直接应用价值