跳转至

R2G: A Multi-View Circuit Graph Benchmark Suite from RTL to GDSII

会议: CVPR 2026
arXiv: 2604.08810
代码: https://github.com/ShenShan123/R2G
领域: AI for EDA / 图神经网络基准
关键词: circuit graph, GNN benchmark, multi-view, physical design, EDA

一句话总结

提出 R2G,首个标准化的多视图电路图基准套件,在 30 个 IP 核上提供 5 种阶段感知的图表示(具有信息对等性),系统研究发现图表示选择比 GNN 模型选择对性能影响更大。

研究背景与动机

图神经网络在物理设计任务(如拥塞预测、线长估计)中应用日益广泛,但进展被不一致的电路表示和缺乏控制变量的评估协议阻碍。现有 EDA 数据集将图表示和任务标签耦合在一起,使得无法区分模型精度来源于架构优势还是表示选择。

R2G 的核心贡献:将表示选择从模型选择中解耦,通过固定电路和任务、仅改变图视图来隔离表示效应,成为首个控制变量的电路图基准。

方法详解

整体框架

从 DEF 文件提取标准化的五种图视图,每种视图编码相同属性集但特征附着位置不同(信息对等性)。覆盖综合、布局和布线三个物理设计阶段。

关键设计

  1. 五种互补视图:包括节点中心视图(信息在节点上)和边中心视图(信息在边上)等,每种视图保持相同的属性集,仅表示结构不同。这种信息对等性是控制变量实验的关键前提。

  2. 端到端 DEF-to-Graph 管线:从标准 DEF 设计文件直接提取图结构、特征和标签,提供统一分割、领域指标和可复现基线。30 个开源 IP 核涵盖从 ~500 到 >10⁶ 节点/边的规模,包括音频控制器(ss_pcm, ac97_ctrl)、加密核心(des3_area, SHA256, AES)、视频控制器(vga_lcd)等多种类别,覆盖综合、布局和布线三个物理设计阶段。

  3. 系统性跨视图研究:使用 GINE、GAT 和 ResGatedGCN 三种代表性 GNN 在五种视图上系统实验,隔离表示效应。

损失函数 / 训练策略

节点级布局任务(HPWL 预测)和边级布线任务(线长预测)使用标准回归损失。统一训练/验证/测试分割确保可复现性。

实验关键数据

关键发现

发现 数据 说明
视图 > 模型 Test R² 跨视图变化 >0.3 固定 GNN 下视图选择主导性能
模型排名翻转 不同视图下最优模型不同 表示-模型耦合严重
节点中心视图最鲁棒 视图 (b) 跨阶段最优 在布局和布线上均表现最佳
解码头深度关键 3-4层 head: R²从-0.17到0.99 远超 GNN 深度的影响

关键洞察

  • 图表示选择比 GNN 架构选择重要得多
  • 解码头深度(3-4层)是精度的主要驱动因素
  • 节点中心视图在布局和布线阶段均泛化最好
  • 五种视图保持信息对等性(相同属性集,仅特征附着位置不同),这是控制变量实验的关键前提
  • Head 深度从 1 层增加到 4 层时,布局任务 R² 从 -0.17 跳升至 0.99,布线任务从 NaN 变为收敛
  • 不同视图下最优 GNN 模型不同,表示-模型耦合严重

亮点与洞察

  • 首次将图表示作为独立变量进行控制实验
  • "视图选择主导模型选择"的发现对 EDA-ML 社区有重要指导意义
  • 解码头深度的惊人重要性可能改变 GNN 架构设计思路
  • 信息对等性设计是严格消融的基础

局限与展望

  • 仅 30 个 IP 核,多样性有限
  • 五种视图未穷尽所有可能的电路表示
  • 主要聚焦后端物理设计,前端逻辑设计未涉及
  • 未探索异构图神经网络(如区分单元和网络节点类型)在多视图上的表现
  • 数据集规模从 ~500 到 >10⁶ 节点/边,跨度大但每个规模段的样本数有限
  • R2G 继承了 OGB 等图 ML 基准的最佳实践:统一分割、可扩展加载器、可复现基线
  • 现有 EDA 数据集将图表示和任务标签耦合,R2G 通过解耦实现了首个控制变量实验

评分

  • 新颖性:⭐⭐⭐⭐⭐ — 首个控制变量的多视图电路图基准
  • 技术深度:⭐⭐⭐⭐ — 信息对等性设计严谨,确保实验的可控性
  • 实验充分度:⭐⭐⭐⭐ — 系统性跨视图跨模型实验
  • 实用价值:⭐⭐⭐⭐ — 为 EDA-ML 研究提供标准化工具,代码和数据集开源