从 2023 年的 RAG 热潮到 2025 年被称为”Agent 之年”,AI Agent 正在从”会对话的工具”进化为”能自主行动的协作者”。这一进化不仅是模型能力的提升,更是围绕模型的工程体系在持续演进:
Agent 的进化本质上是在探索:如何让 Software 3.0 可靠地工作。
┌──────────────────────────────────────────────────────────────┐
│ 用户 / 外部系统 │
├──────────────────────────────────────────────────────────────┤
│ 第三篇:实践层 │
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────────────┐ │
│ │ Agentic │ │ Claude Code │ │ 评测 / 可观测性 / │ │
│ │ Coding (ch7) │ │ 深度解析(ch8)│ │ 安全 (ch9) │ │
│ └──────┬───────┘ └──────┬───────┘ └──────────┬───────────┘ │
├─────────┼────────────────┼────────────────────┼──────────────┤
│ 第二篇:架构层 │
│ ┌──────┴───────┐ ┌──────┴───────┐ ┌─────────┴──────────┐ │
│ │ Harness 工程 │ │ 设计模式 │ │ 记忆与自进化 │ │
│ │ (ch3) │ │ (ch4) │ │ (ch5) │ │
│ └──────┬───────┘ └──────┬───────┘ └─────────┬──────────┘ │
│ │ ┌───────────┴───────────┐ │ │
│ │ │ Agent 框架全景 (ch6) │ │ │
│ │ └───────────────────────┘ │ │
├─────────┼────────────────────────────────────┼──────────────┤
│ 第一篇:基础层 │
│ ┌──────┴──────────────────┐ ┌───────────────┴──────────┐ │
│ │ 提示词工程 (ch1) │ │ 上下文工程 (ch2) │ │
│ └─────────────────────────┘ └──────────────────────────┘ │
├──────────────────────────────────────────────────────────────┤
│ LLM (大语言模型) │
└──────────────────────────────────────────────────────────────┘
| 术语 | 英文 | 定义 |
|---|---|---|
| 提示词工程 | Prompt Engineering | 设计和优化输入给 LLM 的文本指令,以获得期望输出 |
| 上下文工程 | Context Engineering | 设计动态系统,在正确时间以正确格式提供正确信息和工具给 LLM |
| Harness | Harness | 围绕 LLM 的运行时编排系统,管理工具调度、上下文、安全的”外层循环” |
| Scaffolding | Scaffolding | 构建时(启动前)的系统组装——系统提示、工具 Schema、子 Agent 注册 |
| 上下文窗口 | Context Window | LLM 单次推理能处理的最大 token 数量 |
| 工具调用 | Tool Use / Function Calling | LLM 通过结构化输出调用外部工具的能力 |
| 记忆 | Memory | Agent 跨会话持久化信息的机制,包括情景、语义、程序三类 |
| 自进化 | Self-Improvement | Agent 从错误和反馈中自动学习并改进行为的机制 |
| TAOR | Think-Act-Observe-Repeat | Claude Code 的核心循环架构,扩展自 ReAct 范式 |
| ReAct | Reasoning + Acting | 将推理和行动交织在循环中的 Agent 基础范式 |
| Sub-Agent | Sub-Agent | 主 Agent 派生的子任务执行者,拥有独立上下文窗口 |
| Compaction | Compaction | 自动压缩对话历史以回收上下文窗口空间的机制 |
| MCP | Model Context Protocol | 模型上下文协议,用于连接外部工具和数据源 |
| Skill | Skill | 封装特定能力的可复用模块(如 OpenClaw 的技能系统) |
| Eval | Evaluation | Agent 能力评测体系,包括 Benchmark 和领域特定测试 |