写公众号最折磨人的不是动笔。是排队。
选题 30 分钟、查资料 1 小时、写稿 2 小时、审校 30 分钟、配图 20 分钟。每个环节都得盯着前一个 AI 跑完才能开始下一个。我后来意识到,我不是在写文章,我是在陪 AI 排队。
这篇要解决的就是这件事:用 Hermes 搭一个 3 Agent 流水线,把调研、写作、审校三件事拆给三个 AI 并行跑,整篇压缩到 10 分钟出初稿。
pipeline
用过 Claude Code 或 Cursor 的话,Hermes 上手几乎没成本。它就是一个跑在终端里的 AI 代理,但多了一层派发能力。
最直观的对比:
Hermes 比单 Agent 工具多出来的核心能力就三件:
delegate_task() 拉起子 Agent,每个子 Agent 独立上下文,互不污染。SKILL.md,Agent 加载就会用。剩下的 toolsets(白名单授权)、profiles(多场景隔离)、depends_on(DAG 调度)都是配套的工程能力。
只想跑单 Agent 串行活,Claude Code 够用。但凡你想让多个步骤并发、让上下文拆分不互相污染、让工具按 Agent 最小授权,Hermes 的多 Agent 模型就是为这些场景做的。
不再绕弯子。咱们直接上手。
# PyPI 一行装(推荐新手)
pip install hermes-agent
# 启动 REPL
hermes chat
# 切到你想用的模型
hermes config set provider anthropic
hermes config set model claude-sonnet-4
装完跑 hermes tools 看下当前账号可用的工具集。默认会有 browser / file / terminal / web / image_gen / delegation / search 这几类。
Hermes 的精髓在 YAML 流水线配置文件。把 Agent 当成函数声明,依赖关系写在 depends_on 里,Hermes 自己按 DAG 排调度。
下面这份配置就是公众号写作流水线的最小可运行版本。5 个 Agent、5 个文件产物、链式 DAG 调度。
# =========================================================
# Hermes 多 Agent 流水线:公众号写作 5 步曲
# 跑法:hermes run --config hermes_agents.yaml --topic "Hermes 入门"
# =========================================================
agents:
topic_scout: # 第 1 步:选题侦察兵
model:anthropic/claude-sonnet-4
toolsets:[web,search] # 只给联网 + 搜索,文件操作不要开
role:leaf # 关键:声明 leaf,禁止递归 spawn
researcher: # 第 2 步:资料研究员
model:anthropic/claude-sonnet-4
toolsets:[file,web] # file 用来读 01-topics.md、写出 02-research.md
role:leaf
writer: # 第 3 步:执笔写手
model:anthropic/claude-sonnet-4
toolsets:[file,skills] # skills 让它能加载「公众号写作」技能
role:leaf
editor: # 第 4 步:审校编辑
model:anthropic/claude-sonnet-4
toolsets:[file] # 最小集:只让它改文件
role:leaf
illustrator: # 第 5 步:配图提示词
model:anthropic/claude-sonnet-4
toolsets:[skills] # 用 image_gen 技能生成配图 prompt
role:leaf
pipeline:
-call:topic_scout # 入口节点,无需 depends_on
goal:"为「{TOPIC}」出 3 个公众号选题候选,输出到 01-topics.md"
-call:researcher
goal:"基于 01-topics.md 整理 6 section 研究资料包到 02-research.md"
depends_on:topic_scout
-call:writer
goal:"据 02-research.md 起草 2500-3000 字实操教程到 03-draft.md"
depends_on:researcher
-call:editor
goal:"审校 03-draft.md,输出三栏 Markdown 表格存到 04-review.md"
depends_on:writer
-call:illustrator
goal:"为 03-draft.md 配 2-3 张图,给出图名+节点文字+用途"
depends_on:editor
这里有几个细节需要注意一下:
role: leaf 必须显式写。不写默认是 general,子 Agent 自己会 spawn 孙子 Agent,token 几分钟烧光。toolsets 走白名单,能少一个就少一个。Editor 只给 file,连 web 都不开。depends_on 替代手写串行,你只声明依赖,Hermes 自己排调度。YAML 适合配置固定的流水线。想动态生成任务、加条件分支、用 Python 拼装任务列表,就走 delegate_task API。
下面这段 Python 是同样的 5 步流水线,能看出它和 YAML 的对应关系。YAML 是声明式,Python 是命令式,干的事一样。
"""
Hermes 多 Agent 流水线 —— Python 入口
跑法:python run_pipeline.py
依赖:pip install hermes-agent
"""
from hermes_tools import delegate_task # Hermes 官方派发 API
# ----------------------------------------------------------------
# 1) 定义 5 个子 Agent 任务(顺序由 depends_on 字段控制)
# ----------------------------------------------------------------
tasks = [
{
"goal": "你是 topic_scout。用户主题:{TOPIC}。请用 web+search 工具调研,"
"输出 3 个公众号选题候选到 01-topics.md。",
"toolsets": ["web", "search"],
"role": "leaf", # 关键:明确 leaf,禁止递归
},
{
"goal": "你是 researcher。据 01-topics.md 整理 6 section 资料包"
"(核心概念/代码/坑点/最佳实践/参考/配图)写到 02-research.md。",
"toolsets": ["file", "web"],
"role": "leaf",
"depends_on": ["topic_scout"],
},
{
"goal": "你是 writer。据 02-research.md 起草 2800 字实操教程,"
"输出到 03-draft.md,必须有 YAML + Python 两段代码。",
"toolsets": ["file", "skills"],
"role": "leaf",
"depends_on": ["researcher"],
},
{
"goal": "你是 editor。审校 03-draft.md,输出三栏 Markdown 表格"
"(原文 / 问题 / 建议)到 04-review.md。",
"toolsets": ["file"],
"role": "leaf",
"depends_on": ["writer"],
},
{
"goal": "你是 illustrator。为 03-draft.md 配 2-3 张图,"
"给出图名+用途+节点文字到 05-illustrations.md。",
"toolsets": ["skills"],
"role": "leaf",
"depends_on": ["editor"],
},
]
# ----------------------------------------------------------------
# 2) 一次性派发:Hermes 默认就是批派发,主 Agent 不阻塞
# Hermes 会按 tasks 里的 depends_on 字段自动排 DAG,
# 没有依赖的同级任务自动并发跑。
# ----------------------------------------------------------------
results = delegate_task(
tasks=tasks,
shared_context={"TOPIC": "Hermes Agent 入门:多 Agent 协作"},
)
# ----------------------------------------------------------------
# 3) 打印每个子 Agent 的 summary(调试用)
# ----------------------------------------------------------------
for r in results:
print(f"[{r['agent']}] -> {r['summary']}")
注意我没像一些老博客那样写 parallel=True。Hermes 的 delegate_task(tasks=[...]) 默认就是批派发,依赖关系由 depends_on 字段决定。它会自动识别哪些任务没依赖、把没依赖的扔到并发队列里跑。parallel=True 是早期接口的遗留,新版 API 不用管。
跑完之后 results 是个列表,每个元素是 {"agent": ..., "summary": ..., "output_path": ...}。要拿哪个文件直接读 output_path。
跑通之后你大概率会问:不就比单 Agent 多个并发?真有那么神?
有。拿数据说话。
Anthropic 2024 年的多 Agent 调研系统报告里有一组数据:开放研究类任务(多跳问题、跨源综合),多 Agent 架构比单 Agent **token 消耗约 4 倍,但准确率从基线 60% 提升到 90%+**。
直观点拆开看。
comparison
维度 | 单 Agent 串行 | 3 Agent 并行 |
|---|---|---|
步骤 | 调研 → 写作 → 审校(必须等前一步) | 调研 ‖ 写作(依赖调研)→ 审校 |
耗时 | 60s + 90s + 30s = 180s | 60s ‖ 90s → 30s = 120s |
上下文 | 单上下文 80k token(所有东西塞一起) | 拆 3 份上下文,各 30k token |
准确率 | 基线 60% | **90%+**(Anthropic 2024 多 Agent 调研报告,原文 baseline ~60%) |
Token 总成本 | 1× | 约 1.4×(端到端,分摊后;内部单次调研 4×) |
由此我们可以得出几个结论:
但多 Agent 不是万灵药。简单任务(步骤 ≤ 3、上下文 ≤ 50k、工具 ≤ 3 个)用单 Agent 更省心。你硬上多 Agent 反而是给自己找事。
判断标准很简单:你的活能不能一句话讲完目标。能,单 Agent;不能,多 Agent。
多 Agent 看着美好,新手实操 90% 的人都死在下面这几个坑里。
pitfalls
给某个子 Agent 同时勾上 browser + file + terminal + image_gen + delegation,结果光工具描述就吃掉 8k token,模型反应慢、还贵。
口诀:能少一个就少一个。Editor 只给 file,Researcher 只给 file + web,别贪。
role="leaf",子 Agent 递归 spawn默认行为下子 Agent 自己也能 delegate_task。一不小心就 spawn 孙子 Agent,孙子再 spawn 曾孙,几分钟 token 烧光。
任何干完活就退出的子 Agent 都必须显式 role: leaf。这个不能省。
上游 Agent 给下游传一句"参考上一份草稿",下游 Agent 经常接错文件、读错段落。
约定:context 字段必须是文件路径 + 字段名(如 02-research.md#section_2),别传自然语言摘要。结构化的好处是出错时你能 grep 到具体哪一步挂了。
SKILL.md 写成长论文有人把整个内部 wiki 塞进一个 skill,加载即占 5k+ token。Agent 干正事之前先消化半天规则。
口诀:单个 skill ≤ 500 token,只放硬约束 + 模板。详细文档放外链,让 skill 触发时再去查。
max_iterations,子 Agent 死循环子 Agent 陷入"调工具 → 看结果 → 再调"死循环,一晚上烧掉 50 美金的真实案例不少。
每个子 Agent 任务都加 max_iterations: 10 上限。到点强制退出,宁可跑不完整也别烧钱。
把项目 A 的 skills 放到全局 ~/.hermes/skills/,项目 B 误用导致模型行为漂移。比如你给代码审查写的 SKILL 跑去污染了公众号写作流水线,文章里开始出现 git diff 风格的语言。
多 Agent/多项目场景下,必须用 ~/.hermes/profiles/<name>/ 严格隔离。每个 profile 独立加载自己的 skills、plugins、cron、memories,互不串台。
6 步流水线 + 2 段代码 + 6 个坑,整篇就是这些。
给你列个最小行动清单:
pip install hermes-agenthermes_agents.yamlhermes run --config hermes_agents.yaml --topic "你的主题"03-draft.md 生成出来,对照这文的 6 个坑自检role: leaf、max_iterations 这些参数,对比下效果第一次跑大概率会在某个 Agent 上挂。这是正常的,挂的点就是你要补的工程化点。多 Agent 的好处就是:editor 挂了不用重跑 writer,从 editor 断点重试就行。
多 Agent 的价值在长任务、长上下文、多工具场景。Claude Code 解决 AI 帮我写代码,Hermes 解决 AI 帮我管一支 AI 团队。
搞清楚这个边界,你就算入门了。