状态新颖性：随机网络蒸馏 (RND)

这部分内容有帮助吗？

参考文献

Curiosity-driven Exploration by Self-supervised Prediction, Deepak Pathak, Pulkit Agrawal, Alexei A. Efros, Trevor Darrell, 2017 International Conference on Machine Learning (ICML) DOI: 10.48550/arXiv.1705.05363 - 介绍了内在好奇心动机（ICM），一种利用环境动力学自监督预测生成内在奖励的基础方法。
A Review on Intrinsic Motivation in Reinforcement Learning, Li Meng, Huixin Tian, Junshan Zhang, 2021 Sensors, Vol. 21 (MDPI) DOI: 10.3390/s21186088 - 提供了强化学习中内在动机技术的全面调查，为RND及其在各种探索策略中的作用提供了更广阔的背景。