趋近智
所有课程
1.1 什么是强化学习?
1.2 智能体与环境
1.3 状态、动作与奖励
1.4 策略:将状态映射到动作
1.5 强化学习工作流程:交互循环
1.6 强化学习任务类型:回合制与连续制
1.7 强化学习与其他学习类型的比较
1.8 为强化学习搭建Python环境
© 2025 ApX Machine Learning