Physics-Informed Autonomous LLM Agents for Explainable Power Electronics Modulation Design¶

会议: AAAI 2026
arXiv: 2411.14214
代码: 无
领域: LLM Agent / 工业应用
关键词: 物理信息agent, 电力电子, 调制设计, PINN, 可解释性

一句话总结¶

提出PHIA系统：LLM规划器通过聊天接口收集设计需求，协调物理信息神经网络代理模型（层次化PINN）和优化算法自主迭代生成电力转换器调制设计方案，MAE降低63.2%、设计速度提升33倍、20位专家验证可用性。

研究背景与动机¶

领域现状：随着可再生能源系统规模扩大，电力电子系统（PES）中的功率变换器调制设计越来越复杂。现有AI辅助方法包括XGBoost代理模型+差分进化优化、Q-learning离线训练等。

现有痛点：(a) 训练数据密集，需要大量仿真或硬件实验数据采集；(b) 计算密集，大模型训练和推理能耗高；(c) 黑盒不可解释，严重限制工业采用；(d) 仅适配特定调制策略或预设目标，扩展性差；(e) 需要大量人工参与设计全过程。

核心矛盾：工业调制设计需要同时满足可解释性、可扩展性和低人工干预，但现有AI方法三者都不理想。

本文目标 给定功率变换器的工作条件、调制策略和性能目标，自动生成最优调制参数，且过程可解释、设置简单、数据需求低。

切入角度：将LLM作为规划器处理自然语言需求，物理信息神经网络作为高效代理模型替代昂贵的仿真/实验。

核心 idea：LLM负责理解需求+规划流程，PINN负责物理建模+性能预测，优化算法负责搜索最优参数——三者分工协作实现端到端自动化设计。

方法详解¶

整体框架¶

前端是聊天界面+GPT-4推理引擎，后端是优化算法+PINN代理模型。流程为：工程师通过聊天提出设计需求 → LLM规划器解析需求生成设计规格 → 规划器调用后端工具集 → 代理模型预测性能指标+优化算法搜索最优参数（迭代循环） → 最终结果可视化展示。

关键设计¶

层次化物理信息代理模型（Hierarchical PINN）：
- 功能：用极少数据高精度预测功率变换器的关键波形和性能指标
- 核心思路：两级层次结构——ModNet（开关级建模）学习半导体开关非理想行为（寄生参数引起的振荡和过冲），输出交流端电压 \(v_p, v_s\)；CirNet（系统级建模）学习电路物理动态，输出电感电流 \(i_L\) 和电容电压 \(v_{C1}, v_{C2}\)。两者都基于LN-GRU时序网络，训练损失包含物理信息损失 \(l_p\)（嵌入Kirchhoff/Faraday/Gauss定律的微分方程约束，公式3-5）和实验数据损失 \(l_d\)，总损失 \(l_{Cir} = \lambda_d l_d + \lambda_p l_p\)
- 设计动机：层次结构将复杂的开关行为和电路物理解耦，ModNet捕捉非理想开关导致的高频振荡（常规网络难以学习），CirNet在此基础上预测系统级性能。物理约束使PINN仅需极少数据（10个样本）就能学习
LLM规划器：
- 功能：通过自然语言接口收集设计需求并协调后端工具执行
- 核心思路：GPT-4作为推理引擎，通过多轮对话交互获取并验证设计规格（额定功率、输入/输出电压、调制策略选择、性能目标优先级）。确认完毕后自主调用后端工具集
- 设计动机：传统设计需要工程师手动计算或编程调用仿真，LLM规划器使非专家用户也能通过自然语言完成设计，同时提供文本解释和可视化输出增强可解释性
优化引擎：
- 功能：迭代搜索最优调制参数
- 核心思路：优化算法将工作条件和候选调制参数传给PINN代理模型获取性能评估，根据评估结果更新搜索方向，迭代直至收敛
- 设计动机：代理模型的推理速度远快于仿真/硬件实验，使迭代优化变得可行；整个工具集可无缝扩展新的代理模型

损失函数 / 训练策略¶

ModNet训练：物理信息损失（开关同步约束）+ 实验数据损失（示波器采集的波形）
CirNet训练（公式7）：物理信息损失（嵌入式微分方程约束）+ 实验数据损失（电感电流测量值），\(l_{Cir} = \lambda_d l_d + \lambda_p l_p\)
超参数搜索：CirNet最优为2层32隐藏神经元（图4，验证集MAE=0.235）

实验关键数据¶

主实验（低数据场景：仅10个训练样本）¶

模型	训练MAE	测试MAE	p-value
SVR	1.984	2.286	1.16E-10*
LSTM	1.164	1.560	7.23E-8*
GRU	1.287	1.604	6.35E-10*
LN-GRU	1.101	1.491	-
CirNet (无ModNet)	-	~0.8	-
PHIA (ModNet+CirNet)	-	最优	-

PHIA的标准MAE比第二名benchmark低63.2%（低数据）、23.7%（高数据），统计显著
用户实验：20位领域专家验证PHIA设计时间比传统方法快33倍以上

消融实验¶

配置	说明
PHIA完整	ModNet+CirNet层次结构，最优性能
仅CirNet	去掉ModNet，无法捕捉非理想开关行为导致的振荡
其他时序模型	LSTM/GRU/TCN/Transformer均显著逊于PHIA

关键发现¶

层次化PINN结构是性能关键：ModNet为CirNet提供了考虑非理想开关行为的输入，这对极端工况下的预测至关重要
物理约束使10个样本即可训练有效的代理模型，传统ML方法需要大量数据
LN-GRU的时序特性契合调制波形预测任务，优于Transformer变体（TST/TSiTPlus）
超参数不敏感：CirNet在2层32隐藏单元附近性能稳定

亮点与洞察¶

PINN+LLM Agent的协作架构极具工业价值：LLM处理自然语言交互和流程编排，PINN处理物理建模和性能预测，各取所长。这种架构可迁移到其他工程设计自动化场景（如芯片设计、结构工程）
极低数据需求：10个硬件实验样本即可训练代理模型，归功于物理先验嵌入——这对数据获取昂贵的工业场景非常关键
可解释性设计：通过聊天界面提供文本解释和可视化输出，满足工业落地对黑盒担忧的需求

局限与展望¶

仅验证了DAB(Dual Active Bridge)一种变换器拓扑，对更复杂的多拓扑系统适用性待验证
LLM规划器依赖GPT-4的API，有延迟和成本问题；可考虑本地部署小模型
物理信息损失中的微分方程需要领域专家手动推导，限制了对新型变换器的快速适配
优化算法的具体选择和收敛保证未详细讨论
系统对硬件故障（如传感器失效、元件老化）的鲁棒性未评估
LLM规划器在安全关键的实时场景中的可靠性需要更严格的验证——电力电子系统故障可能造成硬件损坏
用户研究样本量（20人）偏小，统计结论的稳健性可进一步提升

评分¶

新颖性: ⭐⭐⭐⭐ 首个电力电子领域的LLM agent系统，PINN+LLM协作架构有创意
实验充分度: ⭐⭐⭐⭐ 有20位专家用户研究和统计显著性检验
写作质量: ⭐⭐⭐⭐ 结构清晰，工程细节充分
价值: ⭐⭐⭐⭐⭐ 工业实用性极强，架构可推广