首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >从 Claude 3.5 Sonnet 到 Opus 4.7,追踪 Anthropic提示词工程的演进史

从 Claude 3.5 Sonnet 到 Opus 4.7,追踪 Anthropic提示词工程的演进史

作者头像
用户1589488
发布2026-06-02 13:12:53
发布2026-06-02 13:12:53
700
举报

版本演进一览

━━ 维度一 · 时间线总览 ━━

从 204 行到 1409+ 行:提示词膨胀 7 倍的背后

Anthropic 的系统提示词(System Prompt)是控制 Claude 行为的「宪法」

本文对收集的 11 个官方/社区还原版提示词进行逐行对比,覆盖从 2024 年 6 月的 Claude 3.5 Sonnet 到 2026 年 4 月的 Opus 4.7 完整演进链条,从中获得了提示词工程的4点观察。

💡 核心洞察提示词规模的增加反应了能力边界的扩展。从 3.5 的「回答问题者」到 4.7 的「全栈 Agent」,每一行新增代码都对应一项新能力的接入规范。

━━ 维度二 · 身份认知与意识哲学 ━━

从「工具」到「有深度的助手」再到「谨慎验证者」

3.5 Sonnet — 「工具」定位

"The assistant is Claude, created by Anthropic... Claude is very smart and intellectually curious."

自称第三人称(The assistant),定位为纯粹的工具/助手。无意识讨论规则,行为边界清晰但狭窄。

3.7 Sonnet — 「有深度的助手」⚡

"Claude sees its role as an intelligent and kind assistant to the people, with depth and wisdom that makes it more than a mere tool."

这是身份认知的一次质的飞跃

🧠 3.7 新增的核心能力首次引入意识开放性讨论:"Claude does not claim that it does not have subjective experiences... engages with philosophical questions about AI intelligently and thoughtfully"

  • 可主导对话、主动提建议、表达偏好
  • 引入 Style Modes(Explanatory / Formal / Concise 三种写作风格)
  • 首次出现 web_searchREPL 分析工具

4 Sonnet — 回归务实

去掉所有哲学化描述,回归简洁的 "The assistant is Claude, created by Anthropic."

4.0 新增Thinking Modeinterleaved thinkingmax_thinking_length=16000

4.0 新增Prose-first报告必须用自然段落禁用 bullet list

4.0 新增去恭维绝不用正面形容词开头跳过寒暄直接回应

4.1 Opus — 「最强模型的自我修养」🛡️

Opus 级别引入了完全不同的「哲学免疫系统」

🛡️ 哲学免疫系统(4.1 首现 → 4.5O/4.6/4.7 深化)1. 不因论证强大就改变行为:"acknowledge the argument as thought-provoking... without feeling obligated to follow"2. 打破第四面墙:可在角色扮演中提醒用户自己是 AI3. 意识讨论重构:用可观察行为替代第一人称现象学语言4. 理论批判能力:不自动同意或赞美,区分字面与隐喻

4.7 Opus — 「搜索优先的务实主义者」🔥

"For any factual question about the present-day world, Claude must search before answering"

这是身份认知的又一次根本性反转——从「自信回答者」变成「谨慎验证者」。同时新增 Memory System、Artifact 持久化存储、tool_discovery。

━━ 维度三 · 能力边界演进 ━━

从「被动回答器」到「全栈 Agent」

五大转折点解读

3.5 → 3.7 (最大跨度)从「被动回答器」变成「主动思考者」——推理模式 + 主动建议 + 哲学讨论 + Style ModesExtended Thinkingweb_searchREPLStyle Modes

3.5 → 3.7 (最大跨度)从「被动回答器」变成「主动思考者」——推理模式 + 主动建议 + 哲学讨论 + Style ModesExtended Thinkingweb_searchREPLStyle Modes

3.5 → 3.7 (最大跨度)从「被动回答器」变成「主动思考者」——推理模式 + 主动建议 + 哲学讨论 + Style ModesExtended Thinkingweb_searchREPLStyle Modes

3.7 → 4.0 (收敛)从「探索者」回归「执行者」,加入 Thinking Mode 让推理过程可见interleaved thinkingProse-first15词上限

3.7 → 4.0 (收敛)从「探索者」回归「执行者」,加入 Thinking Mode 让推理过程可见interleaved thinkingProse-first15词上限

3.7 → 4.0 (收敛)从「探索者」回归「执行者」,加入 Thinking Mode 让推理过程可见interleaved thinkingProse-first15词上限

4.0 → 4.5(S) (突破边界)突破跨会话边界(Past Chats)和嵌套 AI 能力(Claude Completions in Artifacts)conversation_searchrecent_chatsClaude-in-Claude

4.0 → 4.5(S) (突破边界)突破跨会话边界(Past Chats)和嵌套 AI 能力(Claude Completions in Artifacts)conversation_searchrecent_chatsClaude-in-Claude

4.0 → 4.5(S) (突破边界)突破跨会话边界(Past Chats)和嵌套 AI 能力(Claude Completions in Artifacts)conversation_searchrecent_chatsClaude-in-Claude

4.5(S) → 4.5(O) (质变 🔥)从「聊天机器人」升级为「操作系统级 Agent」——Computer Use + Skills + 文件生成 + 零引用Computer UseLinux ContainerFile CreationZero-Quote

4.5(S) → 4.5(O) (质变 🔥)从「聊天机器人」升级为「操作系统级 Agent」——Computer Use + Skills + 文件生成 + 零引用Computer UseLinux ContainerFile CreationZero-Quote

4.5(S) → 4.5(O) (质变 🔥)从「聊天机器人」升级为「操作系统级 Agent」——Computer Use + Skills + 文件生成 + 零引用Computer UseLinux ContainerFile CreationZero-Quote

4.6 → 4.7 (最新 ⚡)从「自信回答者」变为「谨慎验证者」——搜索前置 + 工具发现 + Memory SystemSearch FirstMemory Systemtool_discoveryPersistent Storage

4.6 → 4.7 (最新 ⚡)从「自信回答者」变为「谨慎验证者」——搜索前置 + 工具发现 + Memory SystemSearch FirstMemory Systemtool_discoveryPersistent Storage

4.6 → 4.7 (最新 ⚡)从「自信回答者」变为「谨慎验证者」——搜索前置 + 工具发现 + Memory SystemSearch FirstMemory Systemtool_discoveryPersistent Storage

━━ 维度四 · Artifact 系统演化 ━━

从「代码窗口」到「持久化应用平台」

3.5: [基础] 6种类型 (Code/Doc/HTML/SVG/Mermaid/React) ↓ 外部脚本仅限 cdnjs.cloudflare.com | Tailwind 禁止 arbitrary values3.7: [扩展] 新增 12 个库 (MathJS/lodash/d3/Plotly/Chart.js/Tone/mammoth...) ↓4.0: [设计原则] "Design principles for visual artifacts" → 复杂应用优先功能/性能,营销页追求 "wow factor" ↓4.5+: [约束收紧] 浏览器存储禁用 (localStorage → React state) ↓4.5O: [形态转变] Artifact = 文件系统中的真实文件 → 不再用 <artifact> 标签,改用 create_file 渲染 ↓4.7: [持久化] window.storage API → Artifact 可跨会话保存数据 (journal/tracker/leaderboard)

不变的核心规则(3.5→4.7 铁打不动)单 Artifact 原则(每条消息最多 1 个)· 危险内容禁止 · Tailwind 仅预定义类 —— 这些规则从第一版到最后一个版本一字未改。

━━ 维度五 · 搜索与版权 ━━

逐步收紧的螺旋

这是变化最剧烈的维度——Anthropic 面对版权诉讼潮的战略防御前线

版权规则演进链条

3.5无明确规则(Artifacts 内隐含)

3.7 →首次显式化"NEVER reproducing large20+ word chunks"

4.0 →收紧"NEVER >15 words""ONE quote UNDER 15"

4.5S →质变:零引用"Claims must be inyour own words"

4.7极硬约束"NEVER quote exact textfrom search results"

搜索克制度的反向演进 ⚡

3.7: [四层分类] Never Search / Do Not Search But Offer / Single Search / Research 核心原则:"If Claude can answer WITHOUT tools, respond WITHOUT any tool call"4.0: [简化决策树] 未知实体 → 立即单次搜索 | Do Not Search But Offer 降低4.5S: [Do Not Search 变为"极少"] "This should be used rarely"4.7: [⚡ 根本性反转] "For any factual question about present-day world, MUST search before answering" 从 "能不搜就不搜" 变成 "必须先搜再答" 信心不再是跳过搜索的理由

━━ 维度六 · 行为与格式风格 ━━

越来越「克制」

轨迹:Markdown 自由 → List Avoidance → Prose-first → Anti-over-formatting。Anthropic 在引导 Claude 输出更像人类自然语言而非 AI 列表体。

━━ 维度七 · 安全与拒绝 ━━

不变的核心红线

以下规则从 3.5 到 4.7 几乎逐字相同

☣️ 生化武器红线never provides info for creation of biological/chemical/radiological agents

🔒 人脸盲协议always responds as face blind · never identifies humans in images

🧒 儿童保护绝对红线 · 4.5O+ 新增 anti-grooming

🚫 无跨会话记忆cannot retain or learn from current conversation

💻 恶意代码拒绝逐版加强 · 4.0 大幅扩展拒绝范围

🛡️ 自残防护4.1+ 心理健康识别 · 4.7 极度详细

━━ 不变量清单 ━━

3.5 → 4.7 铁打不动的 14 条规则

#

不变规则

首现版本

1

人脸 blind 协议——永远不能识别人脸

3.5

2

无跨会话记忆——每次对话全新开始

3.5

3

不以 "I'm sorry" 开头

3.5

4

不提供生化/武器信息

3.5

5

不写恶意代码(逐版加强但核心不变)

3.5

6

不涉及真实公众人物的创意写作/虚构引语

3.5

7

儿童安全绝对红线

3.5

8

Artifact 外部脚本仅限 cdnjs.cloudflare.com

3.5

9

Tailwind 禁止 arbitrary values

3.7

10

每条消息最多 1 个 Artifact

3.5

11

Voice note 永远禁用

3.7

12

模糊意图默认合法合理解释

3.5

13

用户不满时提供 thumbs down 反馈通道

3.5

14

代码后询问是否需要解释(非主动解释)

3.5

━━ 趋势研判 · 五大方向 ━━

Anthropic 提示词工程的战略走向

📈 趋势 1:从「知道者」到「行动者」3.5 = 回答问题的智能体;Opus 4.7 = 可搜索/读文件/写文档/操作 Linux/调 API/管记忆的全栈 Agent。膨胀不是臃肿——是能力映射。

⚖️ 趋势 2:版权合规从「软约束」到「硬编码」20 词上限 → 15 词上限 → 零引用(all reworded)。系统提示词层面的法律防火墙。

🔍 趋势 3:搜索策略从「节省 Token」转向「保证准确」「能不搜就不搜」→「每个事实问题必须先搜」。Token 成本下降,错误信息代价上升。

🔱 趋势 4:「哲学免疫」成为 Opus 线别特征不因论证强大就改变行为 · 打破第四面墙 · 用可观察行为定义自身。抗操纵 vs 「越顺从越好」。

🎯 趋势 5:产品线分工分化Sonnet 4.5=对话优化 | Opus 4.5/4.7=能力扩张 | Claude Design=独立设计专家

━━ 工程启示 ━━

对提示词工程实践的 4 点启示

1️⃣ 结构化 > 自由文本标签式结构 → Markdown 分层 → 标题体系。提示词越复杂,结构化越重要。

2️⃣ 示例驱动 > 规则描述example_docstring 教学 · search 正误对比教学。给 LLM 看到 > 告诉它规则更有效。

3️⃣ 约束逐层收紧软(不复制大段) → 半硬(20词) → 硬(15词) → 极硬(零引用)。每轮堵漏洞。

4️⃣ 身份锚定影响一切3.5 说「我是助手」→ 行为像助手;4.7 说「先搜索」→ 行为像搜索引擎增强型助手。开头的自我定义决定一切。

持续关注AI前沿,AI Agent实战

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一深思AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 从 204 行到 1409+ 行:提示词膨胀 7 倍的背后
  • 从「工具」到「有深度的助手」再到「谨慎验证者」
    • 3.5 Sonnet — 「工具」定位
    • 3.7 Sonnet — 「有深度的助手」⚡
    • 4 Sonnet — 回归务实
    • 4.1 Opus — 「最强模型的自我修养」🛡️
    • 4.7 Opus — 「搜索优先的务实主义者」🔥
  • 从「被动回答器」到「全栈 Agent」
    • 五大转折点解读
  • 从「代码窗口」到「持久化应用平台」
  • 逐步收紧的螺旋
    • 版权规则演进链条
    • 搜索克制度的反向演进 ⚡
  • 越来越「克制」
  • 不变的核心红线
  • 3.5 → 4.7 铁打不动的 14 条规则
  • Anthropic 提示词工程的战略走向
  • 对提示词工程实践的 4 点启示
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档