提示词的版本控制

随着您对提示词 (prompt)进行迭代，根据评估结果优化指令、添加示例或调整上下文 (context)，您会很快发现追踪这些变更变得非常必要。就像源代码一样，提示词是您应用程序开发过程中的核心资产。如果没有系统的方法来管理它们的演进，您就有丢失有效版本、引入回退或难以重现以前结果的风险。这时，版本控制系统，尤其是 Git，就变得必不可少。

将版本控制原则应用于您的提示词带来多项重要好处：

追踪历史： 您可以获得提示词每次变更的完整历史记录。您可以查看谁在何时更改了什么，以及理想情况下为什么更改（通过提交信息）。这对于理解提示词如何达到当前状态非常有帮助。
可重现性： 如果新的提示词迭代表现不佳或破坏了功能，版本控制允许您轻松恢复到先前已知可用的版本。这个安全网鼓励尝试。
协作： 当多个团队成员进行提示词工程时，版本控制系统可以避免冲突的变更，并为所有提示词提供一个中心、共享的真实来源。团队成员可以审查彼此的提示词修改。
实验： 版本控制使得尝试不同提示词变体变得安全。您可以创建单独的分支来测试新想法（例如添加思维链推理 (inference)或尝试少样本示例），而不会影响主要工作提示词。
将提示词与性能关联： 通过将提交哈希与评估结果关联，您可以明确地将特定提示词版本与观察到的性能指标关联起来，使您的变更影响清晰可见。

使用 Git 实现提示词 (prompt)版本控制

最常用且有效的方法是使用 Git 对提示词进行版本控制，这与管理源代码所用的工具相同。以下是具体做法：

1. 将提示词存储在您的代码库中： 将您的提示词文件视为任何其他开发产物。将它们直接存储在您项目的 Git 仓库中。

文件格式： 纯文本文件（.txt）或 Markdown（.md）对于简单提示词通常足够。如果您的提示词涉及复杂的结构或模板化（这在框架中会更常见），请考虑使用结构化格式，例如 YAML（.yaml）或 JSON（.json）。这些格式更易于程序化解析，并能清楚地划分提示词的不同部分（指令、示例、输入占位符）。
组织方式： 在您的代码库中创建一个专用目录，也许命名为 prompts/ 或 prompt_templates/，用于存储这些文件。您可以根据应用程序功能或任务进一步组织它们（例如，prompts/summarization/，prompts/qa_system/）。

2. 编写有意义的提交信息： 这点很重要。像“更新了提示词”这样的提交信息没有帮助。相反，请描述什么改变了以及为什么改变。良好的提交信息可以充当您迭代过程的文档。

示例：
- feat(prompts): 为分类任务添加两样本示例
- fix(prompts): 澄清摘要器提示词中的 JSON 输出结构
- perf(prompts): 缩短合规性提示词的上下文以减少 token 数量
- refactor(prompts): 重写指令以提高清晰度

3. 使用分支进行实验： 善用 Git 分支同时管理不同方向的提示词开发。如果您想测试一种明显不同的方法，请创建一个新分支：

# 切换到主分支（如果不在主分支）
git checkout main

# 创建并切换到新的实验分支
git checkout -b experiment/try-role-prompting

# 在此分支中修改您的提示词文件...
# git add prompts/your_prompt.txt
# git commit -m "实验：测试分配“专家分析师”角色"

# 在此分支上评估提示词...

如果实验成功，您可以将分支合并回您的主开发线。如果失败，您可以简单地丢弃该分支，不动您的主要提示词。

这是 Git 分支如何用于管理提示词实验的简化视图。每个方框代表一个已提交的提示词版本，可能位于不同分支。

4. 记录提示词元 (token)数据： 虽然 Git 追踪变更，但它本身不存储与提示词版本相关的上下文 (context)或性能。考虑添加元数据：

在注释中： 在提示词文件本身内包含注释，详细说明其目的、它设计的LMM目标，以及在成功测试期间使用的重要生成参数 (parameter)（如温度）。
README 文件： 在您的提示词目录中添加一个 README.md 文件，解释每个提示词文件的目的以及使用的任何约定。
记录结果： 当您运行评估时（如前一部分所述），在结果旁边记录所测试提示词版本的 Git 提交哈希。这建立了一个可追溯的记录，将特定的提示词代码与其性能关联起来。

通过将提示词视为开发流程中的一等公民并应用标准版本控制实践，您为系统化提示词工程奠定根基。这种方法确保您的进度得到追踪，实验易于管理，协作有效，最终带来更可靠、更高性能的 LLM 应用程序。尽管专业的提示词管理平台正在出现，但掌握这些 Git 版本控制基本技巧会带来直接且显著的益处。

使用 Kerb 更快构建 LLM 应用

简洁的语法。内置调试功能。从第一天起就可投入生产。

为 ApX 背后的 AI 系统而构建

这部分内容有帮助吗？

参考文献

Pro Git, Scott Chacon, Ben Straub, 2014 (Apress) - Git的基础指南，解释了其对管理提示演变至关重要的概念和操作。
Prompt Engineering Guide, Prompt Engineering Guide Community, 2024 - 一个全面的、社区维护的资源，详细介绍了提示设计、迭代和最佳实践。