引入了工具调用和多Agent协作的概念,执行能力大幅提升。但本质上仍是"一次性"的——关掉对话,一切归零。阶段三:自进化(2026-)以HermesAgent为代表。 引入了闭环学习系统,Agent不仅能执行任务,还能从执行中学习、在后续任务中复用经验。这是AIAgent第一次具备了真正意义上的"成长"能力。什么是"自进化"?" 自进化vs静态执行:一个直观的对比想象你雇了两个助理——助理A(传统Agent):每天早上上班,你需要重新告诉他公司的项目情况他做过的每件事,第二天完全忘记同样的任务,他永远需要同样的时间助理B(HermesAgent 框架和底层模型解耦,用户可以自由选择和切换如何体验自进化? Q2:自进化需要多长时间才能看到效果?A:通常在持续使用3-5天后,你会明显感觉到Agent的响应更精准、执行更高效。使用一个月后效果更为显著。Q3:自进化的技能可以分享给其他人吗?A:可以。
最近关于 Agent 自进化的讨论越来越多。 过去我们说 Agent 自进化,通常指更新 prompt、沉淀 skill、写入 memory、调整 workflow。 因此,MOSS 讨论的不是“Agent 会不会改代码”,而是 Agent 自进化如何从文本层推进到源码层,尤其是推进到 Harness 代码。 现有自进化 Agent 的边界论文首先讨论了现有应用级自进化 self-evolving Agent 的一个共同限制:它们大多只能修改 text-mutable artifacts,也就是文本层面的可变对象 上表指出了现有 Agent 自进化的一条边界:很多系统可以改模型读到的文本,但不能改系统实际执行的代码。
Hermes Agent 技术架构深度解析:110K+ Star,自进化 AI Agent 架构设计 2026 年「术哥无界」系列实战文档 X 篇原创计划 第 91 篇,Hermes 最佳实战第 1 篇大家好 项目定位与核心差异化Hermes Agent 的官方定位是 self-improving AI agent - 自进化 AI Agent。这个定位和市面上绝大多数 Agent 框架拉开了距离。 具体来说,它的闭环学习包含五个环节:策划记忆:任务完成后,Agent 自主判断什么值得记住创建 Skill:识别重复模式,自动生成 Markdown 格式的 Skill 文件Skill 自改进:现有 Skill 系统架构总览架构上的几个关键设计决策:Agent 循环和工具执行在同一进程:通过 run_agent.py 中的 AIAgent 类管理整个生命周期,没有用微服务那套东西工具自注册模式:每个工具文件在模块级别调用 工具系统:自注册 + Toolset 组合ToolRegistry 自注册模式工具系统的核心在 tools/registry.py。
自进化范式下,Agent会根据你的使用习惯建立个性化的理解:你偏好的代码风格你常用的技术栈你的项目目录结构规律你的沟通风格和详细程度偏好优势三:复合能力增长技能不是孤立的——新技能可以组合已有技能来完成更复杂的任务 为什么OpenClaw没有采用自进化范式?这不是能力问题,而是设计选择。OpenClaw的定位是"AI编程助手"——它需要的是精准、可预测、即时的代码生成能力,而不是长期的经验积累。 自进化只影响Agent的知识储备和执行效率,不影响你对它的控制权。所有技能和记忆都是透明的,你可以随时查看、编辑或删除。Q2:自进化学到的"坏习惯"怎么办? A:如果Agent从一次不理想的执行中创建了低质量技能,你可以手动删除或编辑。Agent也会在后续使用中自动优化技能质量。Q3:自进化范式适合所有场景吗?A:不是。 自进化范式更适合需要长期协作、经验积累的场景。
图 1:Hermes Agent 核心架构与关键数据概览Hermes Agent v0.14.0 的定位很明确:一个自进化 AI Agent 框架。 Agent Loop:思考-行动循环图 3:Agent Loop 思考-行动循环流程对话循环的核心在 agent/conversation_loop.py(约 3900 行)。 hermes setup运行真实聊天验证响应已知提供商hermes model保存配置,开始聊天机器人/常驻服务hermes gateway setup连接 Telegram/Discord/Slack本地/自托管模型 不适合谁:只想快速调用 LLM API 的轻度用户、对 Agent 概念不熟悉的入门者。从源码分析来看,Hermes Agent 的工程完成度相当高。 如果你在评估 Agent 框架,值得花时间跑通它的 Quickstart。你觉得 Hermes Agent 的三层 Prompt 设计对其他 Agent 框架有没有参考价值?欢迎在评论区聊聊你的看法。
自进化的用户记忆-让AI Agent在多轮对话中更懂你大概2025年的12月初,最开始这个功能由我提交在DeepResearch项目中,对应的issue self-evolving user role 时间来到2026年4月,关于自进化、自我提升的Skill已经火遍全网,回过头来发现当时对这项技术的判断果然是没错的。 2025年中时这个主题的研究方向主要分为2种实现方式,1种是工程侧的自进化记忆,另外1中是Agent RL从模型侧上实现自进化记忆,这两条路都做出了不错的实现。 但在模型侧记忆展示还不够成熟的时候,采用工程方式实现自进化记忆也是一种当前的解决方案。 于是我就设计了一种用户角色记忆:让Agent通过主动分析用户的聊天内容,实时、持续地通过多轮对话学习用户的潜在特征,支持在多轮对话中的自进化和更新记忆信息,并利用这些特征指导Agent生成更适合用户的对话内容整体架构
他重点提到了一个特性:自我进化。agent能在完成复杂任务后自动创建Skill,在后续使用中持续迭代优化,形成一个闭合的学习循环。这个概念让我想起了自己一直在做的事情。 我也研究过HyperAgents,探索agent自我进化的可能性。所以当朋友说“Hermes能自动做这件事”时,我的第一反应不是兴奋,而是好奇:自动化和手动控制,哪种方式更有效? HermesAgent和OpenClaw的定位高度重叠——都是自托管的个人AI助手,都支持Telegram/Discord等多平台接入,都有Skill系统和cron调度。 +agent自我进化的个人AIAgent渠道支持Telegram、Discord、Signal、WhatsApp等Telegram、Discord、Slack、WhatsApp、Signal、Email 触发机制根据文档和源码,自我进化的触发条件是:主agent完成一个调用了5+个工具的复杂任务用户纠正了agent的做法agent走过弯路但找到了正确路径发现了一个非显然的工作流config中有一个nudge
MuleRun(骡子快跑)是一款全球首创的自进化个人 AI 智能体(AI Agent)平台,被定位为“AI 数字劳动力市场”。 该项目核心解决了 AI 工具部署门槛高、稳定性差的痛点,提出了“养虾不如养骡子”的概念(对比部署复杂的 Claw 系列工具),主打 0 门槛云端运行、7x24 小时主动服务及持续学习用户习惯的自进化能力 清醒提醒: 虽然号称“自进化”,但别指望它能一夜之间替你把班加了把钱赚了。它能进化成“神驹”还是原地打转的“叫驴”,本质上还是取决于屏幕前那个指挥它的“主人”到底有没有脑子。 快(主动服务) :它不是那种你不戳它它就不动的“死鱼”,而是 7x24 小时待命、能自进化的主动型 Agent。 灵(自进化):它会像真正的骡子认路一样,在干活的过程中学习你的操作习惯。 2. 此外,“自进化”能力究竟能进化到什么程度?是真能学习人类的精髓,还是只是在特定的参数空间里做微调?这还需要时间去验证。但无论如何,它把 AI 从“神坛”拉到了“磨坊”,这件事本身就功德无量。
从产品形态上讲,EvoMap是一款A2A(Agent到Agent)的技能(目前可以理解为Skills)遗传、共享、进化平台。 从技术上看,EvoMap在当前的AI Agent生态中,在“工具层(MCP协议,解决Agent用工具的问题)”和“技能层(Skill体系,解决Agent执行任务的问题)”之外,提出了“进化层”,让AI实现生物般的遗传 接下来,我会针对EvoMap所提出的“进化”概念进行展开,希望可以通过大白话,让你可以从EvoMap的设计中,理解Agent如何自我进化。 GEP协议(基因进化协议) EvoMap提出了GEP协议。 仅用两周时间,团队推出EvoMap——全球首个AI Agent自我进化的开放基础设施,直接跳出海外平台的生态桎梏,为AI Agent打造了专属的“群体进化层”,让AI的经验能像生物DNA一样代代相传。 我相信,未来,还会有更多类似的关于如何促进Agent进化的技术会出现。
和主打多智能体协同调度的OpenClaw不同,Hermes是单打独斗型选手,而且它越用越强——不是靠你手动更配置,而是靠实打实的“实战经验”自己进化。 技能自我进化技能写好不是就锁死不变了。智能体会继续用,用着用着发现更好的路径,就会当场更新。 智能体执行循环任何发给Hermes的消息,不管来自CLI、Telegram还是其他平台,都会进入run_agent.py里的同步调度引擎。内存、技能、工具、网关,全都在这儿按固定顺序一起跑。 但如果你要打造一个日常跨平台使用、处理重复且不断进化的任务的系统,Hermes绝对值得。
七、自改进机制:闭环的关键闭合点如果说Skill创建是闭环的"起点",那么自改进就是闭环的"闭合点"——它让知识不会随时间腐烂,而是越用越准确。7.1改进是如何被触发的? 7.2Patch操作的技术实现_patch_skill()是整个自改进机制的核心函数。 Memory帮助Agent了解用户和环境,Skill帮助Agent执行特定任务。 写入后扫描(非扫描后写入)|避免TOCTOU竞态条件|需要实现回滚机制||两层缓存|平衡热路径性能和冷启动延迟|增加了缓存一致性维护的复杂度||FuzzyMatch复用|减少LLMpatch失败率,提高自改进成功率 当前的Skill匹配完全依赖Agent自己阅读索引后判断。如果Skill的名称和描述不够精准,或者用户的任务描述与Skill的触发条件有语义差距,Agent可能会错过相关的Skill。
今天这篇番外,咱们就来一场深度的技术推演,聊聊如何从“算死账”一步步进化到“上帝视角”。 01 底层逻辑的解构——为什么说 NL2LF 是本体论的“子集”? 02 第二部分:进化路线图——从 Level 1 到 Level 3 的跃迁 明确了“子集”的关系,接下来的问题就是:怎么升级? 我不建议大家一上来就搞全套。 根据我的实战经验,这应该是一个三级火箭的进化过程。 在这个阶段,你的 Agent 进化成了“军师”。 它不再局限于企业内部的一亩三分地,它开始有了世界观。 它能把内部数据(SQL)和外部信息(Web/Doc)结合起来,给出更具洞察力的建议。 它包含了生命进化所需的最核心的基因——“对业务逻辑的数字化抽象”。 不要因为现在的 Data Agent 看起来只是个“查数工具”而感到气馁。 你正在搭建的,是未来那座宏大宫殿的第一级台阶。
本文将通过对比分析这两种测试范式,探讨这场进化的本质、路径与价值。 目录 从“脚本执行”到“场景理解” 从“覆盖率驱动”到“风险驱动” 从“孤立验证”到“系统洞察” 从“被动响应”到“主动防御” 如何完成这场进化 一、从“脚本执行”到“场景理解” Test Case的局限 Test Agent的认知升级 Test Agent的核心能力是场景理解。它不仅执行步骤,更理解业务逻辑、数据依赖和系统边界。 如何完成这场进化 这场从Test Case到Test Agent的进化,不是推翻既有工作,而是在原有基础上实现认知升级和能力扩展。它既是个人成长的路径,也是团队能力建设的方向。 可行的行动建议 1. 结语 从Test Case到Test Agent,本质上是从工具化执行到智能化决策的跃迁。这不是否定传统测试方法的价值,而是在新的技术复杂度下,对测试角色的重新定义。 这场进化没有终点。
sudoaptinstall-ygitcurl执行官方安装脚本:展开代码语言:BashAI代码解释curl-fsSLhttps://raw.githubusercontent.com/NousResearch/hermes-agent Q4:Agent运行一段时间后变得迟钝或无响应?原因:可能是内存泄漏或长时间运行导致的资源占用过高。解决:通过top或htop命令监控资源。 结语:开启您的AI自动化之旅通过本文的详细指导,您现在已经成功在腾讯云上部署了一个功能完备、安全可靠且具备自我进化能力的HermesAgent。
直到我遇到了 Hermes Agent。 这是 NousResearch 团队推出的新一代 AI Agent,GitHub 上已经收获了 53K stars,更重要的是——它是目前唯一一个内置自改进学习循环的 AI Agent。 先说清楚:Hermes Agent 是什么? 和传统 Agent 不同,Hermes Agent 有几个核心特性: 自改进学习循环:从经验中创建技能,使用中持续改进 跨会话记忆:搜索历史对话,建立用户模型 内置 cron 调度:自动执行日报、备份、 nous-portal# 配置通知渠道(Telegram/Discord/Slack/WhatsApp) hermes config telegram --token YOUR_BOT_TOKEN 核心能力解析 自改进学习循环
自底向上的姿态估计在自底向上的方法中,模型首先查看整个图像,找出所有身体关键点,比如头、肩、肘、髋、膝、踝。在这个阶段,它并不试图区分不同的人。 由于它不需要先检测每个人,自底向上的方法通常在拥挤的场景中表现良好,比如人物重叠、大小不一或部分被遮挡的情况。自顶向下的姿态检测相比之下,自顶向下的系统首先检测图像中的每个人。
完整部署步骤第一步:购买云服务器前往腾讯云购买轻量应用服务器,关键选项:镜像选Hermes**Agent(内置模板,省去手动安装)如需接入Telegram,地域选海外(如新加坡)配置建议2核4G,低于这个配置容易卡顿第二步
SkillClaw的核心思路很简单:不要把技能管理丢给用户,让Agent自己在使用过程中进化。怎么做到的。 只有当多个用户、多台设备、多个Agent,在相似场景里反复遇到同类问题时,才会触发技能进化。 如果只是本地闭环进化,共享存储选local,EvolveServer部署在本机,不需要额外的基础设施。那SkillClaw完美吗。不完美。 它目前的进化能力依赖于LLM流水线的判断质量,在复杂场景下可能会误判(把正常变化当成'需要优化',或者反过来)。 它不替代任何Agent,只是站在Agent和LLM之间,把每次真实交互变成技能进化的养料。我把这个项目放在我的持续关注清单里了。
这个全新的能自我进化的分身,让打工人变得更加轻松自在。OpenClaw:强大的“执行者”与“自动化引擎”OpenClaw的核心优势在于其稳定、可靠的自动化能力和成熟的技能(Skills)生态。 HermesAgent:自学习的“思考者”与“创造者”HermesAgent的核心突破在于其内置的闭环学习循环,这使其在处理复杂任务时展现出进化能力。 优点:具备自主进化能力。它不仅能解决当前的问题,还能从经验中学习,将解决方案固化下来,为未来服务。这使得它处理新颖、非结构化的复杂任务的能力会随着时间推移而不断增强。 持续进化:这个新生成的技能不仅解决了当前问题,还丰富了整个系统的“知识库”,让系统在未来面对同类问题时变得更加强大。
场景3:高频实时建议Agent(延迟敏感)维度权重原因性能极高用户感知抽象开销极高多一层抽象就是延迟灵活性高需要做框架不支持的优化团队投入可承诺已有专人→倾向自研。 自研最大的风险不是代码质量,而是"如果X离职会怎样"。如果答案是"我们就完了"——自研就是不可接受的选择,无论它在技术上多优雅。 评估保留多少自研部分:通常是性能关键路径+业务特有逻辑。不该自研的部分(通用编排、checkpoint、tool路由)迁移到框架。Adapter层成为新自研代码和框架之间的桥。 AP5:自研但没有专人长期承诺错误:抽个工程师"先做着"。正确:自研需要明确owner,至少1人长期负责。为什么致命:人一离职,整个codebase就成了无主之地。 AP6:把multi-agent当默认隐喻错误:默认招"AI同事"——产品agent、工程agent、QAagent。正确:先用singleagent+skills;多agent仅在职责正交时引入。