趋近智
所有课程
5.1 基于模型的强化学习的理由
5.2 基于模型方法的分类
5.3 学习环境动态模型
5.4 Dyna 架构:学习与规划的结合
5.5 使用已学习模型进行规划:轨迹采样
5.6 蒙特卡洛树搜索(MCTS)基本原理
5.7 将MCTS与习得模型整合
5.8 模型预测控制 (MPC) 的关联
5.9 挑战:模型准确性与计算成本
5.10 简单基于模型的智能体实践
© 2025 ApX Machine Learning