
本文记录了WorkBuddy个人工作助手记忆系统从三层架构到GEM架构( Gene-Executive-Memory)的演进。三层记忆架构解决了AI跨会话记忆保持问题,但在实际使用中暴露出策略信号稀释、失败经验分散、调度机制缺失、记忆类型边界模糊四大问题。GEM架构通过Gene方法论引入,将常驻注入从~6400 token精简至~1720 token(-73%),建立显式路由表、双节点蒸馏机制和三类记忆分类管理,实现"策略信号密度提升"与"懒加载真正生效"。
2026年初,在使用各种原生大模型辅助工作时,发现一个核心问题:上下文切换成本太高。
每个平台都需要重新说明背景,重复沟通消耗了30-50%的时间。上下文断裂,信息无法跨平台流转。同样需求在不同工具中重复表达,无法形成工作流。工具之间互相独立,无法配合完成复杂任务。
更严重的是"金鱼记忆"问题:上下文窗口有限,超出后早期对话内容会被压缩或丢弃。对于需要持续数周、数月的工作,这种机制完全无法胜任。
为解决上述问题,建立了三层记忆架构,借鉴人类认知模型:
层级 | 名称 | 存储内容 | 注入方式 |
|---|---|---|---|
L1 | 范式层 | 身份设定、工作原则、组织架构 | 系统强制注入 |
L2 | 档案层 | 项目档案、技术经验、用户偏好 | 自动注入 |
L3 | 会话层 | 当日对话、临时任务、实时记录 | 需主动读取 |
核心思想:不在一个篮子里放所有鸡蛋。会话上下文窗口是L3会话层的工具,L1和L2通过文件系统持久化,不受上下文窗口限制。
三层记忆架构建立后,解决了跨会话记忆保持问题,并建立了三项核心成果:
成果一:铁律体系
在工作区根目录的导航文档中注入三条铁律:
成果二:信息归属判定
建立判断口诀:
成果三:实践验证
两个完整案例验证了三层记忆的有效性:
随着系统不断扩展,三层记忆架构在实际使用中暴露出四个根本性问题。
现象:范式层文档体量膨胀,策略被背景稀释。
在工作区的范式层,有多个身份设定和工作原则文档。随着时间推移,这些文档不断积累内容,从最初的简洁策略,变成了详细的操作手册。
问题本质:同样字数,组织成"策略"才有用,组织成"摘要"没用。长文档把强模型的固有能力直接压住了,只有核心策略层真正起作用,背景说明、详细示例、模板填充都在稀释控制信号。
现象:失败经验的警告信号分散在多个文档中,有重复有遗漏。
在工作区的各类文档中,散布着各种"不要这样做"的警告。这些警告分布在范式层的身份设定文档、工作原则文档、工具配置文档等多个位置。
问题本质:失败经验不应该原样堆砌叙事,应该提炼为警告信号。分散导致AI无法在关键时刻触发正确的约束,重复导致注入冗余,遗漏导致关键风险未被覆盖。
现象:缺少统一的调度路由表,AI需要从多个文档中拼凑调度逻辑。
在工作区,有大量详细的工作原则文档和技术经验文档。这些文档通过范式层的身份设定文档引导加载,但没有显式的"元路由表"。
问题本质:懒加载最大的风险不是"存了找不到",而是"不知道该找"。没有显式路由表,AI不知道"开发任务→加载哪个文档",导致懒加载机制无法真正生效。
现象:范式层中既有硬约束(必须常驻),又有软经验(应降级为长期记忆),混合在一起。
在工作区的工具配置文档中,既有技术环境的硬约束(Python路径、Node路径,必须常驻),又有技术经验(PPT设计踩坑、Python环境配置经验,应降级为长期记忆),两者混合在一起。
问题本质:陈述性记忆(事实性知识)与程序性记忆(执行策略)混合,导致职责不清。硬约束应该常驻注入,软经验应该按需加载,但缺乏明确的分类机制。
2026年4月22日,研读清华xEvoMap论文(arxiv 2604.15097),发现关键结论:
条件 | Skill包(~2,500 token) | Gene对象(~230 token) |
|---|---|---|
强模型Pro | 60.1→50.7 (-9.4pp) | 显著提升 |
弱模型Flash | 41.8→49.0 (+7.2pp) | 显著提升 |
核心洞察:
心智系统四层模型与GEM架构的映射:
认知组件 | 功能 | GEM映射 |
|---|---|---|
工作记忆 | 舞台有限,当前任务 | 会话上下文 |
中央执行系统 | 舞台总监,控制注意力 | Gene层(策略模板池+路由表) |
陈述性记忆 | 后台,事实性知识 | 长期记忆(晶体记忆+索引) |
程序性记忆 | 后台,技能性知识 | 长期记忆(策略文档) |
关键概念:
GEM — Gene-Executive-Memory
字母 | 含义 | 对应组件 |
|---|---|---|
G | Gene | 策略模板池(常驻注入的执行策略+警告信号+路由) |
E | Executive | 中央执行系统(调度路由、注意力控制) |
M | Memory | 长短期记忆(晶体化索引+会话日志+蒸馏循环) |
命名理由:3字母简洁有力,G-E-M恰好是三个核心支柱,gem英文意为宝石——双关晶体智力(crystallized intelligence)

维度 | 旧(三层记忆架构) | 新(GEM) |
|---|---|---|
L1/G定义 | 范式层(文档集合) | Gene层(策略模板池) |
L1/G内容 | 3000 token文档 | 1720 token策略信号 |
L2/M定义 | 档案层(全量注入) | 长期记忆(索引+晶体+按需) |
调度机制 | 无(靠AI自觉) | 路由表(显式调度) |
蒸馏 | 无 | 双节点(任务完成+每日压缩) |
警告信号 | 分散叙事 | Gene constraints统一管理 |
记忆类型 | 边界模糊 | 三类分类管理 |
Gene结构规范(~50 token each):
## Gene: [名称]
**SIGNALS**: [触发信号,逗号分隔]
**STRATEGY**: [核心策略,2-3句话]
**CONSTRAINTS**: [警告信号,如有]十个核心Gene:
Gene | SIGNALS | 核心策略 |
|---|---|---|
Gene 1: Identity | 会话启动、身份确认 | 统领四大总监,结果导向 |
Gene 2: TaskManagement | 新任务、预估>4轮对话 | 立即创建任务目录 |
Gene 3: MemoryManagement | 任务完成、每日22:00 | 追加每日记录 + 记忆压缩 |
Gene 4: DevelopmentTask | 开发、编程、测试 | 先读开发总纲文档 |
Gene 5: SkillInvocation | 调用MCP/Skill | 先理解通信协议本质 |
Gene 6: FileOperation | 写入文件、删除文件 | 根目录只放文件夹 |
Gene 7: SafetyBoundary | 支付相关、外部通讯 | 四条红线必须征询 |
Gene 8: ToolMemory | 创建/安装新技能 | 更新源文档→同步经验文档 |
Gene 9: KnowledgeMemory | 知识密集型任务完成 | 抽取知识→输入知识库 |
Gene 10: StrategyMemory | 发现策略模式、用户显式要求 | 确认长期记忆→确认进Gene池 |
针对"记忆类型边界模糊"缺陷,建立三类分类管理机制:
工具类记忆(Gene 8: ToolMemory)
知识类记忆(Gene 9: KnowledgeMemory)
YYYY-MM-DD_[主题]_[类型].md(类型:概念/方法/经验/技术/流程)策略类记忆(Gene 10: StrategyMemory)
针对"调度机制缺失"缺陷,建立显式路由表:
任务类型 | 加载文档类型 | 详细原文(归档) |
|---|---|---|
开发任务 | 开发规范晶体化文档 + 开发组织文档 | 开发规范源文档 + 开发组织源文档 |
记忆操作 | 记忆策略晶体化文档 | 记忆控制源文档 |
技能调用 | 技术经验晶体化文档 | 工具配置源文档(双向同步) |
组织协作 | 组织协作流程晶体化文档 | 组织架构源文档 |
原型设计 | 原型规范晶体化文档 | 原型规范源文档 |
定时任务 | 定时任务晶体化文档 | - |
任务管理 | 任务管理晶体化文档 | - |
安全边界 | 安全边界晶体化文档 | - |
知识沉淀 | 知识类记忆Obsidian规范文档 | 知识类记忆源文档 |
警告信号管理 | 警告信号汇总表 | - |
路由铁律:路由表是懒加载生效的前提,无路由则不知道该找。详细原文供深度查询时使用。
针对"失败经验分散"和"进化机制缺失"问题,建立双节点蒸馏:
触发节点 | 时间点 | 蒸馏目标 | 输出 |
|---|---|---|---|
任务完成节点 | 任务结束立即 | 单任务经验 | 追加每日记录 + 可能更新长期记忆 + 可能创建晶体记忆 |
每日压缩节点 | 22:00晚间检查 | 当日所有任务 | 每日记录归档 + 长期记忆更新 + 可能Gene进化 |
任务清单:
关键细节:
任务清单:
关键细节:
任务清单:
关键细节:
任务清单:
关键细节:
任务清单:
关键细节:
任务清单:
关键细节:
指标 | 改造前 | 改造后 | 改善幅度 |
|---|---|---|---|
常驻注入体量 | ~6400 token | ~1720 token | -73% |
Gene数量 | 0 | 10 | +10 |
晶体记忆文件 | 0 | 10 | +10 |
归档源文档 | 0 | 9 | +9 |
路由表 | 无 | 1(10条路由) | +1 |
警告信号统一管理 | 分散6+文件 | 集中于Gene(27条) | 统一 |
效果一:策略信号强度提升
从3000 token稀释→1720 token纯策略。Gene论文证明:同样字数,组织成"策略"才有用,组织成"摘要"没用。
效果二:调度可预测
路由表显式定义,懒加载真正生效。之前的问题是"不知道该找",现在路由表告诉AI"开发任务→加载开发规范文档"。
效果三:失败经验可用
警告信号统一管理,不再分散叙事。之前警告信号分散在6+文件中,现在统一整合到各Gene的CONSTRAINTS部分。
效果四:进化自动化
双节点蒸馏,持续提炼。任务完成节点+每日压缩节点,任一触发即可。
效果五:认知科学对齐
GEM架构符合中央执行系统+陈述性记忆+程序性记忆模型。这不是巧合,而是刻意设计的结果。
效果六:记忆分类管理
三类记忆(工具类/知识类/策略类)各有明确的触发时机、执行流程、判断标准,避免混乱。
效果七:知识沉淀自动化
知识类记忆自动输入知识库,无需手动整理,形成知识库。
效果八:Gene池同步机制
策略类记忆进Gene池后,自动触发常驻注入文档和完整定义文档同步更新,确保Gene池定义与实际一致。
洞察一:Gene赢的不是长度,是形态
长Skill把强模型的固有能力直接压住了。只有策略层真正起作用,背景说明、详细示例、模板填充都在稀释控制信号。
洞察二:警告信号是失败经验的最佳形态
失败经验不应该原样堆砌叙事,而应该提炼为警告信号。警告信号统一管理,不再分散叙事。
洞察三:路由表是懒加载生效的前提
懒加载最大的风险不是"存了找不到",而是"不知道该找"。路由表显式定义,AI才知道"开发任务→加载开发规范文档"。
洞察四:蒸馏需要双节点触发
单节点蒸馏容易遗漏。双节点(任务完成+每日压缩)设计,确保持续提炼。
洞察五:记忆需要分类管理
三类记忆(工具类/知识类/策略类)各有不同的触发时机、执行流程、判断标准。工具类同步到经验文档,知识类输入知识库,策略类可能进Gene池。混淆会导致管理混乱。
洞察六:知识类不进Gene池
知识类记忆是陈述性记忆(事实性知识),Gene池是程序性记忆(执行策略)。两者功能不同,不应混合。
洞察七:策略类进Gene池需要同步
策略类记忆进Gene池后,必须同步更新完整定义文档,否则会导致Gene池定义与实际不符。
洞察八:知识库是知识沉淀的最佳位置
知识库提供RAG检索能力,适合存储知识类记忆。通过命名规范和目录分类,形成知识库。
三层记忆架构解决了AI跨会话记忆保持问题,但存在策略信号稀释、失败经验分散、调度机制缺失、记忆类型边界模糊四大缺陷。GEM架构通过Gene方法论引入,实现了:
这不是终点,而是新的起点。当然产品不断在迭代,WorkBuddy将继续进化,从工具到伙伴,从伙伴到生态,作为使用者而言如何用好更新的机制将是持续的挑战。
文档附注
本文旨在完整记录笔者在VibeWorking过程中,从三层记忆到GEM架构的演进历程,开放出来给各位开发者借鉴,为后续维护和优化提供理论基础和实践参考,如果你对于技能包、工程文件感兴趣,可以在评论区探讨。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。