添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
ICLR Mar, 2023

MAESTRO: 多智能体强化学习的开放环境设计

TL;DR 本文提出了 Multi-Agent Environment Design Strategist for Open-Ended Learning (MAESTRO) 算法,该算法在多智能体环境中使用 Unsupervised Environment Design (UED) 生成敌对性的联合任务集,MAESTRO 在竞争性的两人游戏中,跨离散和连续控制环境优于其他基线方法,并在 Nash 均衡点上获得了最小化后悔的保证。