The best AI systems aren’t born from bigger models, but from better engineering.
最优秀的 AI 系统并非来自更大的模型,而是来自更好的工程设计。
更新日志2025.11.09 全文译自 Weaviate: The Context Engineering Guide
2025.11.12 修订“智能体”章节,增加内容:“从工程角度看智能体”、“如何让上下文“干净又高效”“
2025.11.16 修订“查询增强”章节,增加落地实践等内容
2025.11.17 修订“检索”、“记忆”、“提示词”等章节,每个主题增加如何落地实践等内容
引言
每一个使用大模型进行开发的程序员,最终都会面临同样的问题。最初,你手里有一个非常强大的模型,它能写作、总结、推理,展现出惊人的能力。然而,当你尝试把它应用到现实世界时,问题就开始浮现:它无法回答与你的私有文档相关的问题,对昨天发生的事情也一无所知。而当它不知道答案时,却常常一本正经地胡编乱造,仿佛自己非常确定。
问题不在于模型的智能,而在于它从根本上是“断开的”。它就像一个强大但孤立的大脑,无法访问你的特定数据、无法连接实时互联网,甚至无法记住你上一次的对话。这种孤立的根源来自它的核心架构限制:上下文窗口 。上下文窗口是模型的“工作记忆”,也就是它在执行当前任务时可以存放指令和信息的有限空间。每一个字母、数字、标点符号,都会占用这个窗口的空间。就像一块写满字的白板,一旦写满了,新内容就会覆盖旧内容。重要的信息可能会被“挤掉”,从而遗失。
光靠写更好的提示词是解决不了这个根本问题的。你得在模型的外围,搭建一个能支撑它运行的系统。
这就是上下文工程。
上下文工程 ( Context Engineering ) 是一门设计学科,它的目标是构建一种架构,让大模型在恰当的时机获得恰当的信息。它并不是要改变模型本身,而是要搭建桥梁,把模型与外部世界连接起来,让它能检索外部数据、连接实时工具,并拥有记忆,使它的回答基于事实,而不仅仅依赖训练数据。
接下来的内容就是这一系统的蓝图 ( blueprint ) 。我们将讲解那些能把一个“聪明但孤立”的模型转化为可靠、可投入实际生产的应用所需的核心组件。掌握这些组件的能力,是“一个普通demo”与“一个真正智能的系统”之间的分水岭。
让我们开始吧。
Photo by 
