Spatio-Temporal Graphs Beyond Grids: Benchmark for Maritime Anomaly Detection¶
会议: NeurIPS 2025 (Workshop: AI for Science)
arXiv: 2512.20086
代码: 无
领域: 自动驾驶
关键词: 海事异常检测, 时空图, 非网格环境, LLM智能体, AIS数据
一句话总结¶
提出首个面向非网格时空系统(海事领域)的图异常检测基准数据集,将OMTAD数据集扩展为支持节点/边/图三级异常检测的基准,并计划使用LLM智能体进行轨迹合成和异常注入。
研究背景与动机¶
- 时空图神经网络(ST-GNN)在结构化领域(道路交通、公共交通)成功应用,因节点对应固定空间锚点(交叉路口、车站)
- 海事领域的根本挑战:开阔海面没有自然固定节点,航线不规则且稀疏,图构建本身就是难题
- 异常可能在多个粒度上表现:个体行为异常(节点级)、异常交互(边级)、群体异常(图级)
- 现有海事数据集不是为异常检测设计的,缺乏系统性异常标注
- 预期非网格时空系统将越来越普遍(无人机群、空中交通管理)
方法详解¶
整体框架¶
基于OMTAD数据集的两阶段扩展管线: 1. 轨迹合成器(Trajectory Synthesizer):丰富稀疏区域的船舶间交互 2. 异常注入器(Anomaly Injector):基于LLM提示的语义化异常生成
关键设计¶
数据基础:OMTAD¶
- 西澳大利亚海域(105-116°E, 36-15°S),2018-2020年
- 19,124条轨迹:Cargo(14,384), Tanker(4,020), Fishing(466), Passenger(254)
- AIS记录包括:船舶ID、地理位置、航迹角(COG)、对地速度(SOG)、UTC时间戳
OMTAD的两个局限及解决方案¶
- 稀疏区域无邻居:生成合成但物理合理的伴随轨迹(在SOG/COG/地理位置上有界扰动)
- 无异常标签:通过受控注入过程引入异常
两智能体架构¶
协调器(Coordinator): - 构建标准化感知包(AIS + 衍生特征 + 环境数据 + 溯源信息) - 按顺序调度轨迹合成器和异常注入器
轨迹合成器: - 邻近增强:物理邻近船舶直接纳入 - 合成增强:稀疏区域生成"虚拟邻居",扰动SOG/COG/经纬度
异常注入器(Prompt驱动): - 提示解析:将自然语言描述(如"异常速度变化"、"风险遭遇"、"群体徘徊")解析为结构化意图 - 场景实现:映射为时空图编辑(修改单节点运动学、船舶间交互、群体模式) - 标签生成:附加异常标签(节点/边/图级)+可解释性溯源文本
初步异常注入方法(预实验)¶
- 对长度\(w\)的轨迹选择\(m = r_{node} \cdot w\)的连续异常块
- 扰动SOG和COG的变化率:\(a_i^* = \mu_a + k \cdot \sigma_a\),\(k > 3\)(超出99.7%置信区间)
- 两级控制:\(r_{node}\)控制轨迹内异常密度,\(r_{traj}\)控制数据集级别类别平衡
图构建¶
- 使用OPTICS聚类算法在每个时间戳对空间快照进行聚类
- 从每个簇采样固定数量\(k\)条轨迹
- 在\(w\)小时窗口内构建有向时间图,每图\(k \times w\)个节点
实验关键数据¶
初步实验:图级异常检测¶
| 模型 | \(r_{traj}=0.1\) | \(r_{traj}=0.5\) |
|---|---|---|
| LSTM | 基线 | 基线 |
| LSTM + GNN | 优于LSTM ✓ | 优于LSTM ✓ |
| Transformer | 基线 | 基线 |
| Transformer + GNN | 优于Transformer ✓ | 优于Transformer ✓ |
实验设置¶
| 参数 | 设置 |
|---|---|
| 节点异常比例\(r_{node}\) | {0.1, 0.3, 0.5} |
| 轨迹异常比例\(r_{traj}\) | {0.1, 0.5} |
| 固定\(r_{node}\) | 0.5(初步实验) |
| 扰动强度\(k\) | > 3(超出3σ) |
关键发现¶
- GNN增强模型在所有异常比例下一致性优于纯时序基线
- 图建模更自然地捕获海事动态(需同时考虑船舶状态和船际交互)
- 即使在相对朴素的异常设置下,图结构信号也是有意义的
- 当前仅注入最简单的运动学异常——真实海事异常远更多样
亮点与洞察¶
- 填补重要空白:首个面向非网格时空系统的图异常检测基准
- 三级异常支持:统一支持节点/边/图级异常检测评估
- LLM辅助数据生成:利用LLM智能体生成语义丰富的异常(超越规则驱动注入)
- 可扩展性:框架可推广到无人机群、空中交通等其他非网格时空系统
局限与展望¶
- 当前仅关注运动学异常——需扩展到非法会面、AIS欺骗、环境异常等
- LLM智能体管线尚为规划阶段,未完全实现
- 数据集仅覆盖西澳大利亚单一区域
- 任务特定标签策略需要精细化——跨级别一致可解释标签定义非平凡
- 尚未发布最终版基准数据集
- 未来计划:确定性可再生管线、多基线benchmark、语义复杂异常
相关工作与启发¶
- ST-GNN在结构化域的成功(STGCN, DCRNN, ASTGCN)
- GeoTrackNet, TrAISformer等海事轨迹预测方法
- AD-LLM:LLM辅助异常检测的综合benchmark
- BotSim:LLM驱动的恶意社交僵尸网络生成
- 本文是首次系统性将LLM用于海事域的异常注入
评分¶
- 新颖性:⭐⭐⭐⭐ (非网格时空异常检测+LLM注入的方向新颖)
- 技术深度:⭐⭐⭐ (初步验证阶段,核心方法尚未完全实现)
- 实验充分性:⭐⭐⭐ (仅初步实验,缺乏全面基线对比)
- 写作质量:⭐⭐⭐⭐ (问题定义清晰,未来方向明确)