学术研究报告:基于图神经网络多智能体强化学习的电力-交通融合网协同优化运行
一、作者及发表信息
本研究的通讯作者为福州大学电气工程与自动化学院(福建省电器智能化工程技术研究中心)的江昌旭(第一作者)、卢玥君、邵振国和林俊杰(通信作者)。研究发表于《High Voltage Engineering》(《高电压技术》)2023年第49卷第11期(2023年11月30日出版),DOI编号为10.13336/j.1003-6520.hve.20221965。
二、学术背景与研究目标
本研究属于能源与交通交叉领域,聚焦电力-交通融合网(Integrated Electric Power and Traffic Network, IETN)的协同优化问题。随着电动汽车(Electric Vehicle, EV)的普及,电力系统与交通系统的动态交互日益复杂,涉及多重不确定性因素(如充电需求随机性、交通拥堵、可再生能源出力波动等)。传统优化方法(如静态定价、最短路径算法)难以处理此类动态耦合问题,导致充电成本高、电网峰谷差大等问题。
研究目标包括:
1. 建模动态交互:通过图理论构建EV间的动态网络关系模型,量化多智能体(EV)间的相互影响。
2. 算法创新:提出基于图注意力网络(Graph Attention Network, GAT)的多智能体强化学习算法(Graph Multi-Agent Reinforcement Learning, GMARL),优化EV充电引导策略。
3. 协同优化:结合配电网二阶锥优化(Second Order Conic Relaxation, SOCR)与对偶理论,求解节点边际电价(Locational Marginal Price, LMP),实现电力-交通系统的动态协同。
三、研究流程与方法
1. 动态图模型构建
- 研究对象:区域内100辆需充电的EV(模拟10%渗透率),覆盖108节点交通网络与IEEE 33节点电力系统。
- 图模型设计:将EV视为节点,相邻EV(同路段或半径内)通过边连接,形成动态图结构(GT=(N, E)),以捕捉EV间的时空交互。
GMARL算法开发
配电网最优潮流求解
仿真验证
四、主要结果与逻辑关系
1. 充电引导性能
- 奖励函数:GMARL的单次平均奖励值(111.27)显著高于SD算法(108.39),表明其能有效降低总成本。
- 排队时间:GMARL将平均排队时间从11.46分钟降至1.04分钟(降幅90%),避免了充电站拥堵(图2-3)。
- 峰谷差:GMARL下配电网负荷峰谷差为69.87%,优于SD的70.86%,缓解了电网波动。
电价动态响应
算法鲁棒性验证
五、结论与价值
1. 科学价值
- 提出首个融合图神经网络与多智能体强化学习的IETN协同优化框架,解决了多重不确定性下的动态决策问题。
- 通过注意力机制量化EV间交互影响,为复杂网络中的多智能体协同提供了新方法。
六、研究亮点
1. 方法创新:首次将GAT与多智能体强化学习结合,处理非欧式结构的EV交互数据。
2. 跨学科融合:统一了电力系统优化(SOC松弛)与交通流模型(BPR函数)的数学表达。
3. 工程实用性:在108节点交通网与IEEE 33节点电网中的仿真验证了算法的可扩展性。
七、其他价值
- 开源代码与仿真数据集(未明确提及但可推断)可为后续研究提供基准。
- 研究首次量化了EV协作对充电成本的贡献(如剔除协作后奖励下降20%),为政策制定提供数据支撑。
(注:附录中的图/表未具体展示,但文中引用其关键结论以支持分析。)