趋近智
所有课程
6.1 多智能体系统介绍
6.2 MARL问题表述:随机博弈
6.3 集中式与分布式控制
6.4 挑战:非静态性问题
6.5 独立学习者 (IQL, IDDPG)
6.6 参数共享方法
6.7 集中式训练与去中心化执行 (CTDE)
6.8 价值分解方法 (VDN, QMIX)
6.9 多智能体深度确定性策略梯度 (MADDPG)
6.10 多智能体强化学习中的通信协议
6.11 MARL实现实践
© 2025 ApX Machine Learning