首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏祝威廉

    机器的自我进化

    现在我们是人工去训练,我们也可以完全让机器自己去寻找标注好的数据训练出一个新的机器,实现自我设计和训练,也就是自己的进化

    29810发布于 2018-08-27
  • 来自专栏机器之心

    无需标注图像,VLM也能「自我进化」!RL自我进化框架VisPlay突破视觉推理难题

    最新研究 VisPlay 首次提出了一个自进化强化学习框架,使 VLM 能够仅通过海量的未标注图像数据进行自我演化和能力提升。 VisPlay 将基础 VLM 分解为「提问者」和「推理者」两大角色,通过迭代的自我进化机制协同进化,并结合 GRPO 算法和创新的多样性/难度奖励,平衡了问题的复杂度和答案的质量。 在这样的背景下,研究者开始尝试「自进化」(Self-Evolving)的思路,让模型能通过自我生成、自我修正以及从自身经验中持续学习,从而实现自主的能力迭代。 VisPlay: 基于自我进化的自进化框架 为解决上述挑战,由来自伊利诺伊大学厄巴纳-香槟分校、华盛顿大学圣路易斯分校、马里兰大学、新加坡国立大学的研究团队提出的 VisPlay 框架,首次将自进化强化学习应用于 VisPlay 的核心理念是自我进化(Self-Evolving):它从一个基础预训练 VLM 出发,将其在训练过程中分解成两个相互作用的角色。

    22410编辑于 2025-12-24
  • 来自专栏算法一只狗

    AI自我进化,学会自己写代码了!

    在之前我写过自动生成代码的工具Copilot,它是由Github根据大量的仓库代码进行预训练生成的。如果感兴趣可以具体看回我之前写过的文章。里面由包括安装、使用方法等。

    1.9K30编辑于 2023-01-18
  • 来自专栏机器之心

    CREATOR制造、使用工具,实现LLM「自我进化

    修正(Rectification):运用大模型对于错因推理以及自我修复的能力,对执行阶段捕捉到的问题进行修复。 整个工具创造框架灵活运用了大模型的不同思维能力:提取问题关键信息的抽象思维推理,根据任务实施方案决策的具象思维推理,以及根据问题寻求解决方案的自我修复推理。

    30710编辑于 2023-08-07
  • 来自专栏深入浅出区块链技术

    Conflux的自我进化:从DAG到树图

    采访前我们想要Conflux的首席技术官伍鸣博士帮我们解答的疑问是:「DAG」与「链」的本质区别是什么?我们为什么要用它?它自身的局限性又在哪里?

    1.6K30发布于 2019-04-28
  • 来自专栏华章科技

    【碾压Master】AlphaGo Zero登上Nature,无需人类知识自我进化

    是的,你或许要说,AlphaGo已经在今年5月宣布退休,但AlphaGo的技术将永存,并进一步往前发展、进化。DeepMind已经完成围棋上的概念证明,接下来,就是用他们的强化学习改变世界。 我们训练了一个神经网络来预测AlphaGo自己的落子选择和AlphaGo自我对弈的赢家。这种神经网络提高了树搜索的强度,使落子质量更高,自我对弈迭代更强。 AlphaGo Zero 的神经网络使用自我对弈数据做训练,这些自我对弈是在一种新的强化学习算法下完成的。在每个位置 s,神经网络 fθ 都会进行蒙特卡洛树搜索(MCTS)。 这些新的参数也被用于下一次自我对弈的迭代,让搜索更强。下面的图1 展示了自我对弈训练的流程。 ? 图1:AlphaGo Zero 自我对弈训练的流程:a. 每个网络都被训练以最小化同一个损失函数(公式1),训练使用的是 AlphaGo Zero 在72小时的自我对弈之后产生的同一个自我对弈棋局数据集。

    63340发布于 2018-08-17
  • 来自专栏孟永辉

    产业互联网,互联网的新自我进化

    文/孟永辉 互联网的伟大之处在于自我修正,自我革命,自我进化。 很多人可能并不认同这个观点。 因为在他们的脑海里,资本和流量始终是互联网发展的命脉,为了获得资本和流量,互联网可以无所不用其极。 阿里从B2B到B2C再到手淘;百度从搜索到资讯再到AI;腾讯从社交到游戏再到产业,这些大的脉络背后其实都是互联网在进行自我修正,自我革命和自我进化。 事实上,互联网的自我进化并未停止。 现如今,正在进行的如火如荼的产业互联网,其实依然是互联网自我进化的结果。 为啥这么说呢? 试想一下,如果没有互联网的自我进化自我修正,而是继续沿着早期的发展道路固执地走下去,或许早已被拍死在了沙滩上。 正视产业互联网是互联网自我进化的产物,才能让新产业革命不再是无源之水,无本之木。 千万要记住:互联网的伟大之处在于自我修正,自我革命,自我进化

    56641发布于 2020-10-26
  • 来自专栏DeepHub IMBA

    让 AI 智能体学会自我进化:Agent Lightning 实战入门

    模型权重是静态的,提示词需要人工迭代,整个系统缺乏自我优化的闭环。 Agent Lightning 针对这一问题提出了解决方案。 从更大的视角看,Agent Lightning 代表了智能体开发从静态部署向动态进化的转变。随着这类工具的成熟,智能体将逐步具备自适应能力,成为真正意义上的学习型系统。

    33310编辑于 2026-02-27
  • 来自专栏常用算法专栏

    Hermes Agent 如何让 OpenClaw 技能自我进化

    以下是HermesAgent如何让技能实现“自我进化”的详细解析:核心机制:闭环学习循环(Closed-LoopLearningCycle)HermesAgent的整个工作流程围绕一个强大的闭环展开,这个循环将一次性的任务执行转化为永久性的能力资产 与OpenClaw手动编排的本质区别维度OpenClaw(手动编排)HermesAgent(自我进化)触发条件开发者预见到需求,主动编写。在成功解决一个新问题后,自动触发。创造主体人类开发者。 叠加进化能力:这意味着OpenClaw用户可以在保留所有既有投资的同时,立即获得Hermes的自进化能力。 原有的Skills可以作为基础工具被Hermes调用,而所有新的、复杂的、个性化的任务,则由Hermes的自进化循环来处理和沉淀。 总结HermesAgent的“自我进化”机制,本质上是将“解决问题”的过程与“创造能力”的过程合二为一。它不再是一个被动等待指令的执行者,而是一个主动的学习者和创造者。

    5110编辑于 2026-04-14
  • 认知维度解剖和重构-一份自我进化的手稿

    今天,我将结合个人的历史思考和实践经验,系统性地拆解如何快速提高自身的认知维度,为您后续的自我进化提供一份可执行的“解剖图”。 只有具备了元认知能力,我们才能跳出自我,以第三视角审视自己的思考路径,从而实现自我纠错和自我进化。 七、 突破认知障碍:舒适区的爆破与自我革命 提升认知维度,本质上是一场针对自我的革命,必然伴随着痛苦。最大的敌人就是我们的“认知舒适区”。 只有不断地自我否定、自我重塑,我们的认知系统才能保持开放性和进化能力,最终达到“手中无剑,心中有剑”的专家直觉境界。

    26110编辑于 2026-01-27
  • 来自专栏编程教程

    代理IP与AI自我进化:探索未来智能的新边界

    近年来,代理IP技术的引入为AI的自我进化提供了新的契机,这一技术不仅解决了AI在数据获取上的难题,还为其探索未来智能的新边界铺平了道路。 三、代理IP在AI自我进化中的应用案例 为了更好地理解代理IP在AI自我进化中的应用,以下是一个基于Python的实例,展示如何使用代理IP进行网络数据抓取,并用于AI模型的训练。 1. 四、代理IP在AI自我进化中的潜在价值 通过上述案例,我们可以看到代理IP在AI自我进化中的潜在价值: 扩大数据获取范围:使用代理IP,AI可以访问到更多来源和类型的数据,从而丰富其学习内容和深度。 五、结论 代理IP技术为AI的自我进化提供了新的契机。通过解决数据获取上的难题,代理IP使得AI能够访问到更多、更优质的数据资源,从而加速其学习和进化过程。 总之,代理IP与AI的自我进化之间存在着密切的联系和互动。通过合理利用代理IP技术,我们可以为AI的发展提供更有力的支持,探索未来智能的新边界。

    25510编辑于 2025-08-28
  • 来自专栏知识分享

    达尔文-哥德尔机(DGM):AI自我进化的“永动机”?

    每次进化时,它会从档案库中随机采样,生成新的变体。这种开放式探索避免了陷入局部最优解,就像生物进化中的基因突变一样。哥德尔的贡献是“自我证明”。 不过,这也暴露了一个更深层次的问题:当AI开始自我进化时,我们如何确保它的行为是可控的? 这是一个需要长期研究的课题。五、DGM的未来:AI会取代程序员吗? 但从长期来看,DGM确实为AI的自我进化打开了一扇门。如果AI能够持续自我改进,那么它可能会在更多领域超越人类。比如:科学研究:AI可以自动设计实验、分析数据,甚至提出新的科学假设。 结语:AI的“进化论”才刚刚开始达尔文-哥德尔机(DGM)的出现,标志着AI进入了一个全新的阶段——自我进化。它让我们看到了AI的无限潜力,也让我们意识到,AI的进化可能比我们想象的要快得多。 未来,AI或许真的会像生物进化一样,沿着一条开放式的路径不断自我优化。而我们人类,则需要在这个过程中扮演好“引导者”的角色,确保AI的进化方向是安全、可控、有益的。

    88320编辑于 2025-06-04
  • 来自专栏机器之心

    推动大模型自我进化,北理工推出「流星雨计划」

    大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势,北京理工大学 DIRECT LAB 正式启动了「大模型自我进化」的流星雨研究计划。 核心观点:自我进化的力量 跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation ,方法如下图所示: 该流程提供了一整套从无领域能力进化成领域专家模型的自我进化训练方案,包含三个关键阶段: 第一阶段:导师监督学习,旨在赋予模型基本的领域知识,让模型能够完成领域任务; 第二阶段:自我评估能力习得 ,通过借助通用大模型的指导,进一步迭代训练学习,赋予模型自我评判的能力; 第三阶段:自我提升训练,通过自我批判完成自我进化。 第三阶段:自我提升训练 作者希望模型在最终的领域能力进化过程中能够摆脱对强模型的依赖,实现完全的领域能力自我进化。因此,在模型具有完成自我批判的能力后,他们尝试让模型进行自我进化

    31610编辑于 2025-02-14
  • Hermes Agent深度技术分析:Agent 如何从经验中自我进化

    下面这张图展示了一个Skill从"诞生"到"被使用并自我改进"的完整数据流:让我用一句话概括这个系统的本质:Skills系统让AIAgent像人类专家一样积累经验——把成功的做法写成SOP,在使用中持续修订

    25750编辑于 2026-04-14
  • 多模态数据与模型协同进化自我推理框架

    现有自改进模型虽能迭代优化,但仍面临两大挑战:(1)视觉与文本数据分别增强导致复杂度不匹配(如过于简化的图表配冗余文本);(2)数据与模型进化分离造成任务难度与模型能力失配。 方法提出C2-Evo自动闭环自改进框架,通过双循环机制协同进化训练数据与模型能力:跨模态数据进化循环:基于初始数据集生成复杂多模态问题,结合结构化文本子问题与迭代生成的几何图表数据-模型进化循环:根据基础模型表现自适应选择生成问题

    23310编辑于 2025-09-17
  • 来自专栏前端工程

    我用OpenClaw搭了11个AI Agent,它们学会了自我进化

    今天分享一个让我特别兴奋的进展:我的11个AI Agent终于学会了自我进化。 不是我每天教它们,而是它们自己在观察、学习、调整策略。 什么叫「自我进化」? 先看一张截图,这是墨微Agent(负责公众号)每天自动生成的竞品分析: 它在做什么? Agent军团」进阶角度有效,两篇同日上AI热榜 墨油:Qwen3.5爆款视频验证了CTR改善方案,下个视频准备用「混合流」缩略图 墨圈:修复微博正确UID后,即刻涨粉+5,说明「94万册」简介有效 这就是「自我进化 时间反差+反常识观点 得出结论:「放弃xx」系列可以持续做 更新Playbook:在标题规则里加一条「放弃xx系列有效,数据支撑:03-01测试」 下次创作:读取这条规则,考虑继续做「放弃xx」系列 这就是自我进化 这套系统的价值 对我来说:一个人运营13个平台,靠的就是这套自我进化的系统。 对你来说:如果你也想让AI成为长期伙伴而不是「用完即走」的工具,记忆和进化是必须的。

    1.9K10编辑于 2026-03-04
  • 来自专栏企鹅号快讯

    未来机器人将通过互联网来完成自我进化

    科学家介绍,“机器人大脑”是一个大型计算系统,此系统能学习所有公开、可用的互联网资源。为能成为家庭、办公室及工厂好帮手,机器人也要学习及理解这个世界怎样运转,周围人类是怎样行动的。机器人研究者已教会它们处理一些事情,一般是一次学习及处理一种,如找钥匙、倒饮料、端盘子及何时打断两个人的谈话等,有了“机器人大脑”,此些问题均可一次性打包处理。 据外媒报道,近期在美国伯克利召开的“2014年度机器人技术:科学与系统大会”上,美国科学家发表最新研究成果认为,未来“机器人大脑”将能够从互联网上获取海量信息,然后教

    58870发布于 2018-02-24
  • 来自专栏大模型系列

    Hermes Agent 云端部署:一个会自我进化的 AI Agent

    结语:开启您的AI自动化之旅通过本文的详细指导,您现在已经成功在腾讯云上部署了一个功能完备、安全可靠且具备自我进化能力的HermesAgent。

    7200编辑于 2026-04-15
  • 来自专栏新智元

    语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习

    没有外部数据,AI自己也能进化? 听起来有点吓人,于是谷歌DeepMind的这项研究很快引起了广泛关注。 考虑蓝色虚线的路径,让智能体输出影响未来的智能体输入,并且性能得到提高(自我改进过程),如果输入和输出空间兼容,则这种自我提升是递归的。 自我提升过程的一个典型例子是自我博弈,系统让智能体作为游戏的双方,从生成一个无限的体验流,并带有获胜反馈,来指导学习的方向。 RL的自我纠正能力在这里并不适用,可以自我纠正的是给定反馈的行为,而不是反馈本身。 苏格拉底式学习 与输出仅影响输入分布的一般情况相比,递归的自我提升更具限制性,但中介作用更少,最常见的是将智能体输出映射到输入的环境实例化。

    30910编辑于 2025-02-15
  • Hermes Agent 云端部署实战:一个会自我进化的 AI Agent

    Hermes Agent 在 GitHub 上线仅2周,Star日均增长速度超过了 OpenClaw,是近年来爆发最快的 AI Agent 项目之一。它之所以能引爆社区,核心在于一个简单但颠覆性的设计理念:你不需要训练它,它会自己训练自己。从你开始使用的那一刻,Hermes 就会在后台默默完成三件事:

    2.1K356编辑于 2026-04-13
领券