R2G: A Multi-View Circuit Graph Benchmark Suite from RTL to GDSII¶
会议: CVPR 2026
arXiv: 2604.08810
代码: https://github.com/ShenShan123/R2G
领域: AI for EDA / 图神经网络基准
关键词: circuit graph, GNN benchmark, multi-view, physical design, EDA
一句话总结¶
提出 R2G,首个标准化的多视图电路图基准套件,在 30 个 IP 核上提供 5 种阶段感知的图表示(具有信息对等性),系统研究发现图表示选择比 GNN 模型选择对性能影响更大。
研究背景与动机¶
图神经网络在物理设计任务(如拥塞预测、线长估计)中应用日益广泛,但进展被不一致的电路表示和缺乏控制变量的评估协议阻碍。现有 EDA 数据集将图表示和任务标签耦合在一起,使得无法区分模型精度来源于架构优势还是表示选择。
R2G 的核心贡献:将表示选择从模型选择中解耦,通过固定电路和任务、仅改变图视图来隔离表示效应,成为首个控制变量的电路图基准。
方法详解¶
整体框架¶
从 DEF 文件提取标准化的五种图视图,每种视图编码相同属性集但特征附着位置不同(信息对等性)。覆盖综合、布局和布线三个物理设计阶段。
关键设计¶
-
五种互补视图:包括节点中心视图(信息在节点上)和边中心视图(信息在边上)等,每种视图保持相同的属性集,仅表示结构不同。这种信息对等性是控制变量实验的关键前提。
-
端到端 DEF-to-Graph 管线:从标准 DEF 设计文件直接提取图结构、特征和标签,提供统一分割、领域指标和可复现基线。30 个开源 IP 核涵盖从 ~500 到 >10⁶ 节点/边的规模,包括音频控制器(ss_pcm, ac97_ctrl)、加密核心(des3_area, SHA256, AES)、视频控制器(vga_lcd)等多种类别,覆盖综合、布局和布线三个物理设计阶段。
-
系统性跨视图研究:使用 GINE、GAT 和 ResGatedGCN 三种代表性 GNN 在五种视图上系统实验,隔离表示效应。
损失函数 / 训练策略¶
节点级布局任务(HPWL 预测)和边级布线任务(线长预测)使用标准回归损失。统一训练/验证/测试分割确保可复现性。
实验关键数据¶
关键发现¶
| 发现 | 数据 | 说明 |
|---|---|---|
| 视图 > 模型 | Test R² 跨视图变化 >0.3 | 固定 GNN 下视图选择主导性能 |
| 模型排名翻转 | 不同视图下最优模型不同 | 表示-模型耦合严重 |
| 节点中心视图最鲁棒 | 视图 (b) 跨阶段最优 | 在布局和布线上均表现最佳 |
| 解码头深度关键 | 3-4层 head: R²从-0.17到0.99 | 远超 GNN 深度的影响 |
关键洞察¶
- 图表示选择比 GNN 架构选择重要得多
- 解码头深度(3-4层)是精度的主要驱动因素
- 节点中心视图在布局和布线阶段均泛化最好
- 五种视图保持信息对等性(相同属性集,仅特征附着位置不同),这是控制变量实验的关键前提
- Head 深度从 1 层增加到 4 层时,布局任务 R² 从 -0.17 跳升至 0.99,布线任务从 NaN 变为收敛
- 不同视图下最优 GNN 模型不同,表示-模型耦合严重
亮点与洞察¶
- 首次将图表示作为独立变量进行控制实验
- "视图选择主导模型选择"的发现对 EDA-ML 社区有重要指导意义
- 解码头深度的惊人重要性可能改变 GNN 架构设计思路
- 信息对等性设计是严格消融的基础
局限与展望¶
- 仅 30 个 IP 核,多样性有限
- 五种视图未穷尽所有可能的电路表示
- 主要聚焦后端物理设计,前端逻辑设计未涉及
- 未探索异构图神经网络(如区分单元和网络节点类型)在多视图上的表现
- 数据集规模从 ~500 到 >10⁶ 节点/边,跨度大但每个规模段的样本数有限
- R2G 继承了 OGB 等图 ML 基准的最佳实践:统一分割、可扩展加载器、可复现基线
- 现有 EDA 数据集将图表示和任务标签耦合,R2G 通过解耦实现了首个控制变量实验
评分¶
- 新颖性:⭐⭐⭐⭐⭐ — 首个控制变量的多视图电路图基准
- 技术深度:⭐⭐⭐⭐ — 信息对等性设计严谨,确保实验的可控性
- 实验充分度:⭐⭐⭐⭐ — 系统性跨视图跨模型实验
- 实用价值:⭐⭐⭐⭐ — 为 EDA-ML 研究提供标准化工具,代码和数据集开源