趋近智
在使用大型语言模型(LLM)生成合成数据时,您提供给模型的指令极其重要。这些指令,统称为“提示词”,是您指导LLM输出的主要手段。高效的提示词设计,能将随机生成的文本与适用于训练其他模型的高质量、有目的的合成数据区分开来。可以将提示词看作是对一个非常聪明但严格按字面意思理解的助手的精心提问。您的提问越好,助手的回复就越好。
本节将研究如何构建能有效引导LLM生成您所需合成文本的提示词。您将了解一个好的提示词的构成要素、影响LLM生成过程的方法,以及为获得理想成果而迭代改进提示词的特点。
一个结构良好的提示词通常包含多个协同作用以引导LLM的要素。虽然并非所有提示词都需要每个要素,但了解它们将帮助您为合成数据生成设计更有效的指令。
以下图表说明这些要素如何共同构成一个全面的提示词:
此图表展示了LLM提示词的典型构成块。周全地组合这些要素可以增加您对生成输出的控制。
有几种策略可以大幅提升合成生成文本的质量和相关性。
模糊的提示词会导致模糊或不可预测的输出。您的指令越精确明确,LLM就越能满足您的要求。
为LLM分配一个角色或身份可以深刻影响其生成文本的风格、语气乃至信息的类型。
例如:
“您是一名乐于助人的客服助理。一位客户正在询问退款事宜。生成一个礼貌且富有同理心的回复。”“扮演一位古罗马历史学家。为高中生提供一段关于布匿战争的简短说明。”在生成合成数据时,角色提示可以帮助创建模仿特定用户类型、专家观点或角色声音的文本,从而为您的数据集增加多样性和真实感。
您措辞指令的方式很重要。LLM对直接命令反应良好。
这些术语描述您是否在提示词本身中提供示例。
零样本提示 (Zero-Shot Prompting): 您要求LLM执行任务,而不提供任何明确的期望输出示例。模型完全依赖其预先存在的知识和对指令的理解。
为一款无线耳机生成一篇积极的产品评论。
这适用于期望输出格式简单或标准的快速生成任务。然而,对于更受控的合成数据,它的可靠性可能较低。
少样本提示(Few-Shot Prompting)(上下文学习): 您在提示词中直接包含少量(通常1到5个)输入-输出示例。LLM从这些示例中学习期望的模式、风格和格式。这是一种用于合成数据生成的非常有效的方法。
将以下句子的情感分类为积极、消极或中性。
句子:我爱这款新手机,太棒了!
情感:积极
句子:这部电影真是无聊透顶,而且太长了。
情感:消极
句子:今天天气温和。
情感:中性
句子:这是我几个月来喝过最好的咖啡。
情感:
(LLM预计将用“积极”完成最后一行)对于合成数据生成,少样本提示对于以下任务特别有用:
您的少样本示例的质量和相关性非常重要。它们应准确反映您希望LLM生成的数据类型。
很少能一次就设计出完美的提示词。提示词设计通常是一个试错、观察和改进的迭代过程。
以下图表勾勒了此迭代循环:
迭代改进是提示词设计中的标准做法。预计需要试验和调整您的提示词以获得理想结果。
在为LLM预训练或微调生成合成数据时,输出的结构通常与其内容同样重要。您可能需要JSONL格式、CSV格式的数据,或者像“问题:[问题]\n回答:[回答]”这样的特定文本结构。
控制输出结构的有效方法包括:
生成三个产品名称及其类别示例。
将每个示例以JSON对象形式输出,键为“product_name”和“category”。
生成关于基础化学的问答对。遵循此格式:
问:水的化学符号是什么?
答:H2O
问:地球大气中最丰富的气体是什么?
答:氮气
问:[您的提问在此]
答:[您的回答在此]
当您提供结构化示例时,LLM在后续生成中更可能遵循该结构。对于大型数据集生成,您通常会提供模式的起始部分,并让LLM生成多个实例。让我们看几个生成不同类型合成数据的有针对性示例。
目标: 创建一组关于可再生能源的问题,类型多样(是什么、为什么、如何)。
提示词:
您是一名课程开发者。生成5个关于可再生能源的不同问题。
至少包含一个“是什么”问题、一个“为什么”问题和一个“如何”问题。
确保这些问题适合高中生。
示例格式:
1. 什么是太阳能?
目标: 为指令微调生成数据,让LLM学会遵循指令并提供适当的响应。
提示词(少样本):
生成一条指令和一个相应的准确响应。
指令:用简单的语言解释重力的原理。
响应:重力是使物体相互吸引的力。这就是为什么当你放下物体时它们会落到地上,以及为什么行星会围绕恒星运行的原因。
指令:列出规律运动的三个好处。
响应:规律运动可以通过增强肌肉和心血管系统来改善身体健康,提升情绪和减轻压力,并提高能量水平。
指令:用一句话总结《罗密欧与朱丽叶》的情节。
响应:
(LLM将为最后一条指令完成响应。)
目标: 创建具有特定语气和目标受众的合成客户评论。
提示词:
扮演一个二十岁出头的科技爱好者。为一款名为“Nova X1”的新虚构智能手机写一篇简短而充满激情的评论。
Mention its sleek design and amazing camera. The review should be informal and use one or two popular slang terms appropriately.
长度:2-3句话。
这些示例说明了如何组合任务定义、背景、限制以及有时是示例,从而能有效引导LLM输出以进行合成数据创建。
随着您为各种合成数据需求开发更多提示词,管理它们变得重要。请考虑:
掌握提示词设计是一项实用技能,能极大地增强您使用LLM生成高质量合成数据的能力。这里讨论的原则和策略提供了一个良好的开端。在即将进行的实践环节“使用LLM API生成文本”中,您将有机会直接应用这些技术,并体验提示词工程对LLM输出的影响。这份实践经验将非常宝贵,因为它能帮助您学习如何针对特定的预训练和微调目标定制LLM生成。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造