Scientific Knowledge-Guided Machine Learning for Vessel Power Prediction: A Comparative Study¶

会议: AAAI 2026
arXiv: 2602.18403
作者: Orfeas Bourchas, George Papalambrou 代码: 无
领域: 科学ML / 航海工程
关键词: 船舶功率预测, 混合建模, 物理残差学习, PINN, XGBoost, 外推泛化

一句话总结¶

提出物理基线+数据驱动残差的混合建模框架，将海试功率曲线（螺旋桨定律 $P=cV^n$）作为基线，用 XGBoost/NN/PINN 学习残差修正，在稀疏数据区域显著提升外推稳定性和物理一致性。

动机¶

排放法规趋严：IMO 对航运碳排放的约束日益严格，准确预测主机功率是燃油优化和合规的前提。
传统经验模型不足：海试曲线和静水阻力模型仅捕获速度-功率的立方关系，无法反映风浪、船体污损等复杂工况偏差。
纯数据驱动外推能力差：XGBoost、ANN 等模型在训练分布内精度高，但在高速或极端工况等稀疏区域预测往往违反螺旋桨定律、出现非单调或平坦曲线。
PINN 训练困难：物理信息神经网络虽能引入物理约束，但在含噪实测数据上训练极其困难，难以捕获陡峭梯度和不连续性。
残差混合策略的启示：近年物理信息学习领域中 Stacked Residual 等策略表明，将复杂预测分解为物理基线+残差修正可大幅简化学习任务。
缺乏跨架构系统比较：已有工作未在统一框架下比较 XGBoost、NN、PINN 三类模型在引入物理基线前后的表现差异。

解决思路¶

本文目标：### 整体框架

将功率预测分解为两部分：

\[\hat{P}(\bar{X}) = P_{\text{sea trial}}(V, T) + f(\bar{X})\]

物理基线 $P_{\text{sea trial}}(V, T)$：从海试获得的静水功率曲线，形式为 $P = cV^n$，分别拟合压载（ballast）和满载（laden）工况，中间吃水通过线性插值计算：

$。

方法详解¶

整体框架¶

将功率预测分解为两部分：

\[\hat{P}(\bar{X}) = P_{\text{sea trial}}(V, T) + f(\bar{X})\]

物理基线 $P_{\text{sea trial}}(V, T)$：从海试获得的静水功率曲线，形式为 $P = cV^n$，分别拟合压载（ballast）和满载（laden）工况，中间吃水通过线性插值计算：

\[P_{\text{sea trial}}(V,T) = \left(1-\frac{T-T_b}{T_l-T_b}\right) P_b(V) + \frac{T-T_b}{T_l-T_b} P_l(V)\]

残差回归器 $f(\bar{X})$：数据驱动模型仅学习实测功率与物理基线之间的差异（残差），输入包括风速分量 $W_x, W_y$、船体老化时间等基线未覆盖的因素。

三种回归器的混合配置¶

Hybrid XGBoost：用 XGBoost 预测残差，超参通过 RandomizedSearchCV 优化（学习率、树深度、估计器数量、L1/L2 正则化）。
Hybrid NN：简单全连接网络预测残差，用 Adam 训练 1000 epochs，超参通过 WandB Bayesian sweep 优化（学习率、层数、神经元数）。
Hybrid PINN：在 NN 基础上增加物理损失项。总损失为：

\[\mathcal{L}_{\text{PINN}} = \mathcal{L}_{\text{data}} + \lambda \mathcal{L}_{P.\text{law}}\]

其中物理损失通过对速度求偏导实现螺旋桨定律约束：

\[\mathcal{L}_{P.\text{law}} = \sum_{i}\left(\frac{\partial f}{\partial V}\bigg|_{x_i} - \left[3cV_i^2 - \text{基线导数项}\right]\right)^2\]

$\lambda=100$ 固定权重，所有导数通过 PyTorch autograd 计算。

输入特征¶

符号	描述	单位
$V$	船舶对水速度 (S.T.W.)	kn
$T$	平均吃水	m
Trim	纵倾	m
$W_x, W_y$	真风速的 cos/sin 分量	kn
$t$	记录时间（UTC）	—

实验¶

数据集¶

约 40,000 个数据点，来自真实船舶 5 个月的运营数据，按 80/10/10 划分训练/验证/测试集。

定量结果¶

主实验¶

指标	XGBoost Baseline	XGBoost Hybrid	NN Baseline	NN Hybrid	PINN Baseline	PINN Hybrid
Train MAE [kW]	114.2	143.3	181.0	235.3	147.0	214.7
Train RMSE [kW]	180.5	199.9	229.7	292.1	205.5	248.3
Val MAE [kW]	114.2	143.3	156.3	214.1	135.5	167.2
Val RMSE [kW]	180.5	199.9	212.9	272.4	204.2	219.5
Test MAE [kW]	122.2	148.8	162.7	219.3	144.3	171.2
Test RMSE [kW]	195.0	208.2	225.1	284.3	211.9	229.5

混合模型的全局误差略高于基线模型（差异在船舶最大功率的 1% 以内），但全局指标无法反映稀疏区域的外推行为。

超参对比¶

消融实验¶

超参数	XGBoost Base	XGBoost Hybrid	NN Base	NN Hybrid	PINN Base	PINN Hybrid
学习率	0.25	0.1	1e-4	3e-4	1e-4	3e-4
层/深度	depth=10	depth=10	6层	4层	8层	6层
神经元/估计器	40	500	256	64	256	256
正则化	L1=1,L2=0	L1=1,L2=100	—	—	λ=100	λ=100

外推定性分析¶

在 8–17 kn 速度范围、压载吃水、5 kn 风速条件下（风向 0°/90°/180°），对所有模型评估外推行为： - XGBoost Baseline：高速区频繁出现非单调或平坦的功率-速度曲线，违反物理预期。 - NN Baseline：高速区过估，对风向敏感性异常。 - PINN Baseline：受益于物理损失，但在稀疏区域仍有偏差。 - 所有 Hybrid 模型：功率-速度曲线平滑、单调递增，在训练包络之外保持物理一致性。

主要发现¶

混合框架的核心价值不在于降低全局误差指标，而在于正则化稀疏和外推区域的模型行为。
Hybrid PINN 在所有架构中表现最佳，兼具竞争性精度和最强的物理一致性。
将 ML 任务限制在残差预测上，等效于一种强正则化：模型无需重新发现速度-功率的主导关系。
在天气航线规划和速度优化等实际应用中，决策往往发生在历史数据覆盖最薄弱的区域——正是混合模型优势最大的地方。

关键发现¶

主要组件/模块贡献了最关键的性能提升

亮点与洞察¶

简洁有效的分解思路：用海试曲线做物理基线 + ML 学残差，实现思路直观、工程实用性强。
跨架构统一验证：在 XGBoost/NN/PINN 三种截然不同的架构上均验证有效，说明框架的通用性。
PINN 物理损失的推导：在混合框架下重新推导了 PINN 的物理约束（对残差函数的偏导），数学推导完整清晰。
关注外推而非拟合：不追求训练误差更低，而是关注模型在未见工况下的物理可信度，问题定位精准。

局限与展望¶

物理基线仅使用压载和满载两个吃水条件的线性插值，是对实际非线性吃水-功率关系的简化。
$\lambda=100$ 固定不变，未探索自适应权重调度策略对 PINN 训练的影响。
实验数据仅来自单艘船舶的 5 个月数据，泛化到不同船型和更长时间跨度有待验证。
未考虑船体污损随时间的累积效应建模（仅作为输入特征之一）。
混合模型依赖海试数据的可用性，而非所有船舶都有标准化海试结果。
未与更先进的时序模型（如 Transformer、Mamba）进行比较。

评分¶

新颖性: ⭐⭐⭐ 框架思路直观，核心贡献在于系统性比较而非方法创新
实验充分度: ⭐⭐⭐⭐ 三种架构 × 两种配置的全面对比，含定量和定性分析
写作质量: ⭐⭐⭐⭐ 问题动机清晰、数学推导完整、图表丰富
价值: ⭐⭐⭐⭐ 提供实用的船舶功率预测工具，对天气航线和能效规划有直接应用价值

符号	描述	单位
\(V\)	船舶对水速度 (S.T.W.)	kn
\(T\)	平均吃水	m
Trim	纵倾	m
\(W_x, W_y\)	真风速的 cos/sin 分量	kn
\(t\)	记录时间（UTC）	—