【科技知識 NOW】谷歌曝光AI使用技巧 – 提示技術精髓

Photo of author

By Global Team

谷歌最近发布了一份长达69页的“提示工程”(Prompt Engineering)白皮书。本文作者是Lee Boonstra。该文档系统地整理了根据与人工智能(AI)模型,特别是大规模语言模型(LLM)的交流方式不同,结果也可能会有所不同的观点。

谷歌最近发布了69页的‘提示工程’白皮书。
谷歌最近发布了69页的‘提示工程’白皮书。

最基本的问题方式大致分为四类。没有例子就直接提出问题的零示例(zero-shot)、提供一个例子的单示例(one-shot)、用多个例子确定方向的多示例(few-shot),以及提前告知AI整个对话特征或规则的系统提示(system prompt)。此外,如果包括情境设定或角色分配,AI的响应会更加准确。

零示例(zero-shot)提示示例
零示例(zero-shot)提示示例

白皮书中提出了多种提示技术。当问题简单时,较短的问题足以应对。但对于如逻辑或数学这样的复杂任务,则需要策略。一个典型的例子是“思维链”(Chain of Thought)方法。它是一种引导AI逐步解释思考过程的方法,能够沿袭AI得出答案的过程,并形成合乎逻辑的流程。

思维链(Chain of Thought)提示示例
思维链(Chain of Thought)提示示例

接下来的方法是介绍了ReAct(ReAct),它是推理(reason)与行动(act)相结合的概念。模型在推理后,如有必要,会利用外部工具或信息来解决问题。此外,还介绍了多种技术。例如,树状思维(Tree of Thoughts)是同时探索各种推理路径的方法。自我一致性(Self-Consistency),是指生成多种答案后,选择最为一致的结果。

提示技术如今在编程领域也产生了重大影响。请求直接实现函数或算法时,代码会自动生成。过去需要人类直接编写和测试的工作,现在通过一行提示就能解决。甚至可以为复杂代码的意义逐行解释或自动生成测试代码。该技术已经到达开发者可以立即应用于工作来提高效率的水平。

要提出好的问题,条件必须明确。白皮书强调,在编写提示时,需要清楚地提供指令、相关示例以及期望的结果格式。可以利用temperature、top-k、top-p等设定值来在响应的多样性和一致性之间进行调整。temperature可调节响应的创造性,而top-k和top-p则决定在诸多候选中选择哪个答案。设定值越高,结果越多样化。

最近,甚至连提示编写技术都由AI代劳。不仅涉及文本,还涉及图像、语音等多种输入的多模态提示也在增加。为了在不同模型中使用相同的提示,标准化工作也正在进行。随着AI技术的精细化,问题设计能力日益成为核心能力。谷歌此次发布的这份白皮书是应对此类变化的实用手册。

Leave a Comment