趋近智
第一章介绍了扩展大型语言模型对齐中固有的挑战。本章着重讲解一种提出的解决方案——宪法人工智能(CAI)的理论依据。本章阐述了CAI如何旨在依据预先设定的原则引导模型行为,从而减少对每个生成响应的人工直接反馈的依赖。
您将学习到:
到本章结束时,您将对CAI的运作方式及其设计理由有扎实的理解。
2.1 宪法式AI的核心原则
2.2 设计有效的宪法
2.3 监督学习阶段(批评与修改)
2.4 CAI反馈的数学表述
2.5 与指令遵循的关联
2.6 CAI框架的局限性与评析
© 2026 ApX Machine Learning用心打造