趋近智
所有课程
1.1 监督微调在对齐方面的局限性
1.2 人类反馈强化学习 (RLHF) 面临的挑战
1.3 定义可扩展的监督
1.4 人工智能反馈机制的必要性
1.5 AI辅助对齐的理论体系
© 2025 ApX Machine Learning