暂无搜索历史
本文经 叉鸽 授权,由七牛开发者账号翻译。叉鸽 也是七牛开发者 Router 内容计划的第 6 位作者。
我们平时说 AI 回答慢,一般是遇到这两种情况:一个是问题发出去之后,它隔了一会儿才开始回复;另一个是它已经开始回复了,但输出速度很慢,像是一个字一个字往外蹦。
对个人开发者来说,MCP Server 可能只是本地跑起来的一个小服务;但到了企业环境里,真正有用的 MCP Server 往往都在更封闭的位置:企业内网、私有...
Coding Agent 用久了,规则管理就会变成一个绕不开的问题:哪些内容该放进项目说明,哪些流程得按需调用,哪些动作必须由系统强制执行。
刚刚过去的周末,DeepSeek 发布了一篇关于推理加速的新论文:《DSpark: Confidence-Scheduled Speculative Decod...
今天这篇论文「Agentic Auto-Scheduling: An Experimental Study of LLM-Guided Loop Optimiz...
我们常用的云端模型可以依赖服务器和数据中心,但手机上的模型就没这么强大的后盾。不仅如此,它还要顾及电池、内存、发热,还有尽量别让用户等太久。
有人做了猫猫版 Pokémon GO,有人想象 Claude Code 如果生在 2010 年会长什么样,还有人做了一个 GitHub 账号毒舌评分器。
大多数人打开 Kimi,只是把它当成一个聊天框。输入一个问题,等它回答,然后关掉页面。当然这用法没毛病,但 0xMovez 给出了他的 Kimi 最佳实践,在本...
当我们聊起 Agent,或者阅读相关内容时,经常会看到一个词:MCP。它看起来像一个偏底层的技术名词,我们可以先来简单地记住这样一句话:MCP 是一套让 Age...
上周,在介绍 bugfix 小工具 Superlog,热心群友 Frank 提到了一个小工具 SkillOpt,表示它能把 Skill 当作模型来训练,基于方法...
最近关于 Agent loop 的讨论很多,但「loop(循环)」这个词有时候容易被讲得很抽象。
今天解读的这篇论文叫 TokenPilot: Cache-Efficient Context Management for LLM Agents,作者来自浙江大...
这期的「周一上线」,有点像 AI 终于不满足于“坐在聊天框里等你提问”了。一边,Cursor、GitHub Copilot 继续把 AI Coding 推向开发...
4月23日,国内某大模型发布了关于 Agent 的论文:《AgenticQwen: Training Small Agentic Language Models...
要说世界杯球赛最让球迷抓狂的画面,当属进球之后,射门的球员已经冲向角旗区庆祝,观众已经站起来欢呼,转播画面却突然切到裁判:手指耳机,等待 VAR 确认。随后的几...
世界杯期间,多数人看球的姿势都很相似:两支球队还在进攻阶段,手机可能只是放在一边听个声响;一旦进球出现,大家会立刻点开体育 App:有人刷新比分,有人打开文字直...
这期的「周一上线」有点像“AI 工具继续长手长脚”和“社区整活继续上强度”一起上线。
长上下文模型的能力越来越强,能读的内容也越来越长。但一到真实推理服务里,问题很快就会落到显存上。更准确地说,是 KV Cache。
在 Codex 系列第一篇(上篇),我们用一个很小的本地脚本,跑通了 Codex CLI 的基本流程:进入项目目录,启动 Codex,然后让它读文件、写代码、跑...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市