Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto, 2018 (The MIT Press) - 强化学习领域的权威教科书。第9章和第10章对函数逼近,包括用于价值函数逼近的线性方法和常用特征构建技术,提供了基础性介绍。
Neuro-Dynamic Programming, Dimitri P. Bertsekas and John N. Tsitsiklis, 1996 (Athena Scientific) - 近似动态规划领域的开创性著作,提供了关于函数逼近,包括线性方法及其收敛性质的理论见解,对于理解强化学习算法的稳定性至关重要。