作者:罗俊仁 张万鹏 苏炯铭 王尧 陈璟
智能博弈是认知决策智能领域的挑战性问题, 是辅助联合作战筹划与智能任务规划的关键支撑. 从协作式团队博弈、竞争式零和博弈和混合式一般和博弈共 3 个角度梳理了智能博弈模型, 从认知角度出发定义了运筹型博弈(完全 / 有限理性)、不确定型博弈(经验 / 知识)、涌现探索型博弈(直觉 + 灵感)、群体交互型博弈(协同演化)共 4 类智能博弈认知模型, 从问题可信任解、策略训练平台、问题求解范式共 3 个视角给出智能博弈求解方案. 基于 Transformer 架构重点梳理了架构增强(表示学习、网络组合、模型扩展)与序列建模(离线预训练、在线适变、模型扩展)共 2 大类 6 小类决策 Transformer 方法, 相关研究为开展“离线预训练 + 在线适变”范式下满足多主体、多任务、多模态及虚实迁移等应用场景的决策预训练模型构建提供了初始参考. 为智能博弈领域的决策基石模型相关研究提供可行借鉴.
智能博弈, 智能规划与决策, 认知建模, 离线预训练, 在线适变, 决策基石模型
公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。智能博弈, 智能规划与决策, 认知建模, 离线预训练, 在线适变, 决策基石模型。作者:罗俊仁 张万鹏 苏炯铭 王尧 陈璟。源自:指挥与控制学报。
早期机器学习需要特征工程,需要专业领域的知识,耗时
由于硬件和词嵌入的发展,类似于CNN、RNN的
深度学习
模型出现
问题:除词嵌入外需要从头开始训练模型、需要标记大量实例、成本很高
进而我们期望少量标记实例,尽可能少的训练步数
基于迁移学习(允许重用在源任务中学到的知识,以便在目标任务中很好地执行)的启发:
使用大规模标...