s04

Subagent

Core Loop

Fresh Context per Subtask|200 LOC|5 tools

A subagent is mainly a context boundary, not a process trick.

s00 > s01 > s02 > s03 > [ s04 ] > s05 > s06 > s07 > s08 > s09 > s10 > s11 > s12 > s13 > s14 > s15 > s16 > s17 > s18 > s19

一个大任务，不一定要塞进一个上下文里做完。

这一章到底要解决什么问题

当 agent 连续做很多事时，messages 会越来越长。

比如用户只问：

“这个项目用什么测试框架？”

但 agent 可能为了回答这个问题：

读了 pyproject.toml
读了 requirements.txt
搜了 pytest
跑了测试命令

真正有价值的最终答案，可能只有一句话：

“这个项目主要用 pytest。”

如果这些中间过程都永久堆在父对话里，后面的问题会越来越难回答，因为上下文被大量局部任务的噪声填满了。

这就是子智能体要解决的问题：

把局部任务放进独立上下文里做，做完只把必要结果带回来。

先解释几个名词

什么是“父智能体”

当前正在和用户对话、持有主 messages 的 agent，就是父智能体。

什么是“子智能体”

父智能体临时派生出来，专门处理某个子任务的 agent，就是子智能体。

什么叫“上下文隔离”

意思是：

父智能体有自己的 messages
子智能体也有自己的 messages
子智能体的中间过程不会自动写回父智能体

最小心智模型

Parent agent
  |
  | 1. 决定把一个局部任务外包出去
  v
Subagent
  |
  | 2. 在自己的上下文里读文件 / 搜索 / 执行工具
  v
Summary
  |
  | 3. 只把最终摘要或结果带回父智能体
  v
Parent agent continues

最重要的点只有一个：

子智能体的价值，不是“多一个模型实例”本身，而是“多一个干净上下文”。

最小实现长什么样

第一步：给父智能体一个 `task` 工具

父智能体需要一个工具，让模型可以主动说：

“这个子任务我想交给一个独立上下文去做。”

最小 schema 可以非常简单：

{
    "name": "task",
    "description": "Run a subtask in a clean context and return a summary.",
    "input_schema": {
        "type": "object",
        "properties": {
            "prompt": {"type": "string"}
        },
        "required": ["prompt"]
    }
}

第二步：子智能体使用自己的消息列表

def run_subagent(prompt: str) -> str:
    sub_messages = [{"role": "user", "content": prompt}]
    ...

这就是隔离的关键。

不是共享父智能体的 messages，而是从一份新的列表开始。

第三步：子智能体只拿必要工具

子智能体通常不需要拥有和父智能体完全一样的能力。

最小版本里，常见做法是：

给它文件读取、搜索、bash 之类的基础工具
不给它继续派生子智能体的能力

这样可以防止它无限递归。

第四步：只把结果带回父智能体

子智能体做完事后，不把全部内部历史写回去，而是返回一段总结。

return {
    "type": "tool_result",
    "tool_use_id": block.id,
    "content": summary_text,
}

这一章最关键的数据结构

如果你只记一个结构，就记这个：

class SubagentContext:
    messages: list
    tools: list
    handlers: dict
    max_turns: int

解释一下：

messages：子智能体自己的上下文
tools：子智能体可以调用哪些工具
handlers：这些工具到底对应哪些 Python 函数
max_turns：防止子智能体无限跑

这就是最小子智能体的骨架。

为什么它真的有用

用处 1：给父上下文减负

局部任务的中间噪声不会全都留在主对话里。

用处 2：让任务描述更清楚

一个子智能体接到的 prompt 可以非常聚焦：

“读完这几个文件，给我一句总结”
“检查这个目录里有没有测试”
“对这个函数写一个最小修复”

用处 3：让后面的多 agent 协作有基础

你可以把子智能体理解成多 agent 系统的最小起点。

先把一次性子任务外包做明白，后面再升级到长期 teammate、任务认领、团队协议，会顺很多。

从 0 到 1 的实现顺序

推荐按这个顺序写：

版本 1：空白上下文子智能体

先只实现：

一个 task 工具
一个 run_subagent(prompt) 函数
子智能体自己的 messages
子智能体最后返回摘要

这已经够了。

版本 2：限制工具集

给子智能体一个更小、更安全的工具集。

比如：

允许 read_file
允许 grep
允许只读 bash
不允许 task

版本 3：加入最大轮数和失败保护

至少补两个保护：

最多跑多少轮
工具出错时怎么退出

版本 4：再考虑 fork

只有当你已经稳定跑通前面三步，才考虑 fork。

什么是 fork，为什么它是“下一步”，不是“起步”

前面的最小实现是：

子智能体从空白上下文开始

这叫最朴素的子智能体。

但有时一个子任务必须知道父智能体之前在聊什么。

例如：

“基于我们刚才已经讨论出来的方案，去补测试。”

这时可以用 fork：

不是从空白 messages 开始
而是先复制父智能体的已有上下文，再追加子任务 prompt

sub_messages = list(parent_messages)
sub_messages.append({"role": "user", "content": prompt})

这就是 fork 的本质：

继承上下文，而不是重头开始。

初学者最容易踩的坑

坑 1：把子智能体当成“为了炫技的并发”

子智能体首先是为了解决上下文问题，不是为了展示“我有很多 agent”。

坑 2：把父历史全部原样灌回去

如果你最后又把子智能体全量历史粘回父对话，那隔离价值就几乎没了。

坑 3：一上来就做特别复杂的角色系统

比如一开始就加：

explorer
reviewer
planner
tester
implementer

这些都可以做，但不应该先做。

先把“一个干净上下文的子任务执行器”做对，后面角色化只是在它上面再包一层。

坑 4：忘记给子智能体设置停止条件

如果没有：

最大轮数
异常处理
工具过滤

子智能体很容易无限转。

教学边界

这章要先打牢的，不是“多 agent 很高级”，而是：

子智能体首先是一个上下文边界。

所以教学版先停在这里就够了：

一次性子任务就够
摘要返回就够
新 messages + 工具过滤就够

不要提前把 fork、后台运行、transcript 持久化、worktree 绑定一起塞进来。

真正该守住的顺序仍然是：

先做隔离，再做高级化。

和后续章节的关系

s04 解决的是“局部任务的上下文隔离”
s15-s17 解决的是“多个长期角色如何协作”
s18 解决的是“多个执行者如何在文件系统层面隔离”

它们不是重复关系，而是递进关系。

这一章学完后，你应该能回答

为什么大任务不应该总塞在一个 messages 里？
子智能体最小版为什么只需要独立上下文和摘要返回？
fork 是什么，为什么它不该成为第一步？
为什么子智能体的第一价值是“减噪”，而不是“炫多 agent”？

一句话记住：子智能体的核心，不是多一个角色，而是多一个干净上下文。