趋近智
所有课程
7.1 对齐模型的评估指标
7.2 人工评估方法
7.3 自动化评估套件
7.4 分析RL微调期间的策略变化
7.5 红队测试与安全测试
7.6 计算成本与可扩展性
7.7 RLHF模型的部署考量
7.8 动手实践:分析RLHF运行日志
© 2025 ApX Machine Learning