ICLR
Mar, 2023
MAESTRO: 多智能体强化学习的开放环境设计
MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning
Mikayel Samvelyan, Akbir Khan, Michael Dennis, Minqi Jiang, Jack Parker-Holder...
TL;DR
本文提出了 Multi-Agent Environment Design Strategist for Open-Ended Learning (MAESTRO) 算法,该算法在多智能体环境中使用 Unsupervised Environment Design (UED) 生成敌对性的联合任务集,MAESTRO 在竞争性的两人游戏中,跨离散和连续控制环境优于其他基线方法,并在 Nash 均衡点上获得了最小化后悔的保证。