首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云Agent Memory节省61% Token提升52%成功率的诀窍:Mermaid无限画布×上下文卸载

腾讯云Agent Memory节省61% Token提升52%成功率的诀窍:Mermaid无限画布×上下文卸载

作者头像
腾讯云NoSQL技术
发布2026-05-26 11:05:34
发布2026-05-26 11:05:34
1660
举报
概述
产品已全球开源

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、压缩的艺术
    • 1.1日常生活中的语言压缩
    • 1.2极致压缩:大模型能理解什么样的"符号"
  • 二、Mermaid 无限画布:突破物理窗口的认知空间
    • 2.1 从“压缩单条信息”到“组织任务结构”
    • 2.2什么是 Mermaid 图:一种模型可读写的符号化图语言
    • 2.3 为什么 Mermaid 适合作为任务画布
    • 2.4载体选型:Flowchart vs StateDiagram
    • 2.5从图到画布:把离散摘要组织成任务拓扑符号化
    • 2.6不是无限上下文,而是无限可达空间
    • 2.7画布如何承载长任务:任务状态的外部化
    • 2.8 Agent 如何使用画布:层次化注意力机制
  • 三、TencentDB Agent Memory 的短期记忆压缩方案
    • 3.1 什么是上下文卸载?
    • 3.2 为什么单独用上下文卸载或无限画布都不够?
    • 3.3记忆的折叠:从工具结果到任务画布的具体实践
    • 3.4记忆的展开:从任务画布回到原始证据的具体实践
  • 四、实验设计与结果
    • 4.1 实验设计:把多个任务串成超长 Session
    • 4.2 总体结果:Token 降低的同时,任务完成率没有下降
    • 4.3 SWEbench:代码任务中同时提升完成率与 Token 效率
    • 4.4 Toolathlon:复杂长任务中,通过率从 20% 提升到 35%
    • 4.5 WideSearch:网页搜索任务中 Token 节省最明显
    • 4.6 AA-LCR:长文总结与分析中,总 Token 节省 31%
    • 4.7 消融实验:MMD的作用验证
    • 4.8实验分析小结
  • 五、产品落地与开源
    • 5.1 短期记忆压缩:适合长任务和高工具调用场景
    • 5.2 长期个性化记忆:让 Agent 复用用户偏好
    • 5.3产品化与开源计划
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档