跳转至

Spatio-Temporal Graphs Beyond Grids: Benchmark for Maritime Anomaly Detection

会议: NeurIPS 2025 (Workshop: AI for Science)
arXiv: 2512.20086
代码: 无
领域: 自动驾驶
关键词: 海事异常检测, 时空图, 非网格环境, LLM智能体, AIS数据

一句话总结

提出首个面向非网格时空系统(海事领域)的图异常检测基准数据集,将OMTAD数据集扩展为支持节点/边/图三级异常检测的基准,并计划使用LLM智能体进行轨迹合成和异常注入。

研究背景与动机

  • 时空图神经网络(ST-GNN)在结构化领域(道路交通、公共交通)成功应用,因节点对应固定空间锚点(交叉路口、车站)
  • 海事领域的根本挑战:开阔海面没有自然固定节点,航线不规则且稀疏,图构建本身就是难题
  • 异常可能在多个粒度上表现:个体行为异常(节点级)、异常交互(边级)、群体异常(图级)
  • 现有海事数据集不是为异常检测设计的,缺乏系统性异常标注
  • 预期非网格时空系统将越来越普遍(无人机群、空中交通管理)

方法详解

整体框架

基于OMTAD数据集的两阶段扩展管线: 1. 轨迹合成器(Trajectory Synthesizer):丰富稀疏区域的船舶间交互 2. 异常注入器(Anomaly Injector):基于LLM提示的语义化异常生成

关键设计

数据基础:OMTAD

  • 西澳大利亚海域(105-116°E, 36-15°S),2018-2020年
  • 19,124条轨迹:Cargo(14,384), Tanker(4,020), Fishing(466), Passenger(254)
  • AIS记录包括:船舶ID、地理位置、航迹角(COG)、对地速度(SOG)、UTC时间戳

OMTAD的两个局限及解决方案

  1. 稀疏区域无邻居:生成合成但物理合理的伴随轨迹(在SOG/COG/地理位置上有界扰动)
  2. 无异常标签:通过受控注入过程引入异常

两智能体架构

协调器(Coordinator): - 构建标准化感知包(AIS + 衍生特征 + 环境数据 + 溯源信息) - 按顺序调度轨迹合成器和异常注入器

轨迹合成器: - 邻近增强:物理邻近船舶直接纳入 - 合成增强:稀疏区域生成"虚拟邻居",扰动SOG/COG/经纬度

异常注入器(Prompt驱动): - 提示解析:将自然语言描述(如"异常速度变化"、"风险遭遇"、"群体徘徊")解析为结构化意图 - 场景实现:映射为时空图编辑(修改单节点运动学、船舶间交互、群体模式) - 标签生成:附加异常标签(节点/边/图级)+可解释性溯源文本

初步异常注入方法(预实验)

  • 对长度\(w\)的轨迹选择\(m = r_{node} \cdot w\)的连续异常块
  • 扰动SOG和COG的变化率:\(a_i^* = \mu_a + k \cdot \sigma_a\)\(k > 3\)(超出99.7%置信区间)
  • 两级控制:\(r_{node}\)控制轨迹内异常密度,\(r_{traj}\)控制数据集级别类别平衡

图构建

  • 使用OPTICS聚类算法在每个时间戳对空间快照进行聚类
  • 从每个簇采样固定数量\(k\)条轨迹
  • \(w\)小时窗口内构建有向时间图,每图\(k \times w\)个节点

实验关键数据

初步实验:图级异常检测

模型 \(r_{traj}=0.1\) \(r_{traj}=0.5\)
LSTM 基线 基线
LSTM + GNN 优于LSTM ✓ 优于LSTM ✓
Transformer 基线 基线
Transformer + GNN 优于Transformer ✓ 优于Transformer ✓

实验设置

参数 设置
节点异常比例\(r_{node}\) {0.1, 0.3, 0.5}
轨迹异常比例\(r_{traj}\) {0.1, 0.5}
固定\(r_{node}\) 0.5(初步实验)
扰动强度\(k\) > 3(超出3σ)

关键发现

  • GNN增强模型在所有异常比例下一致性优于纯时序基线
  • 图建模更自然地捕获海事动态(需同时考虑船舶状态和船际交互)
  • 即使在相对朴素的异常设置下,图结构信号也是有意义的
  • 当前仅注入最简单的运动学异常——真实海事异常远更多样

亮点与洞察

  1. 填补重要空白:首个面向非网格时空系统的图异常检测基准
  2. 三级异常支持:统一支持节点/边/图级异常检测评估
  3. LLM辅助数据生成:利用LLM智能体生成语义丰富的异常(超越规则驱动注入)
  4. 可扩展性:框架可推广到无人机群、空中交通等其他非网格时空系统

局限与展望

  • 当前仅关注运动学异常——需扩展到非法会面、AIS欺骗、环境异常等
  • LLM智能体管线尚为规划阶段,未完全实现
  • 数据集仅覆盖西澳大利亚单一区域
  • 任务特定标签策略需要精细化——跨级别一致可解释标签定义非平凡
  • 尚未发布最终版基准数据集
  • 未来计划:确定性可再生管线、多基线benchmark、语义复杂异常

相关工作与启发

  • ST-GNN在结构化域的成功(STGCN, DCRNN, ASTGCN)
  • GeoTrackNet, TrAISformer等海事轨迹预测方法
  • AD-LLM:LLM辅助异常检测的综合benchmark
  • BotSim:LLM驱动的恶意社交僵尸网络生成
  • 本文是首次系统性将LLM用于海事域的异常注入

评分

  • 新颖性:⭐⭐⭐⭐ (非网格时空异常检测+LLM注入的方向新颖)
  • 技术深度:⭐⭐⭐ (初步验证阶段,核心方法尚未完全实现)
  • 实验充分性:⭐⭐⭐ (仅初步实验,缺乏全面基线对比)
  • 写作质量:⭐⭐⭐⭐ (问题定义清晰,未来方向明确)