趋近智
所有课程
6.1 处理大规模状态空间
6.2 价值函数近似 (VFA)
6.3 状态表示的特征向量
6.4 价值函数逼近的线性方法
6.5 用于参数学习的梯度下降
6.6 半梯度 TD 方法
6.7 使用神经网络进行价值函数近似
6.8 实践:应用线性价值函数近似
© 2025 ApX Machine Learning