暂无搜索历史
OpenHands 不是“仓库旁边再放一个聊天框”。它更像一个 AI 开发控制面:前端、app server、sandbox service、代码托管集成、sk...
Serena 有价值,是因为它让 AI coding host 不只是靠全文搜索、文件拼接和模型猜测来理解代码。它通过 MCP 暴露语义代码工具,让 Claud...
FastMCP 的吸引力很直接:你写一个普通 Python 函数,加上 mcp tool decorator,它就可以变成 MCP 客户端能发现和调用的工具。对...
smolagents 吸引人的地方,不只是“几行代码就能跑 agent”。更关键的是它支持 CodeAgent:agent 可以用 Python 代码表达行动,...
我最近越来越不愿意把浏览器 Agent 叫成“自动点网页”。这个说法太轻了。真正的风险不在于它能不能点按钮,而在于它能不能在一个真实账号、真实网页、真实失败状态...
Pydantic AI 最容易被误读成“又一个 Python Agent 框架”。这个理解不算错,但太粗了。它真正适合的场景不是把一个 prompt 包成 Ag...
很多团队接入 AI Agent、RAG 或客服机器人时,最容易晚一步做的事情就是评估。先把模型、prompt、工具调用、RAG 检索串起来,等 demo 能跑,...
很多人把向量数据库接到 Agent 里时,第一反应是“把 embedding 存进去,再让模型查”。这条路能跑起来,但也很容易把问题藏起来:Agent 查到的东...
E2B 很容易被一句话讲成“给 AI Agent 一个安全沙箱,让它可以跑代码”。
很多人第一次看 LangGraph,会把它理解成“更复杂一点的 LangChain”。这个理解容易把重点带偏。
很多团队把 LLM eval 当成“上线以后再慢慢补”的事情。这个顺序通常会带来一个问题:等系统已经接入真实用户、真实工具和真实预算以后,再去讨论“什么算失败”...
很多团队接入 LLM 应用时,会先把 prompt 调顺,再补一个“评测脚本”。这个顺序很容易出问题:等到线上开始失败时,大家才发现自己没有定义过什么叫通过、什...
这也是我阅读 Doramagic 的 agent-memory manual 时认为最重要的点:它不应该被理解成“给 Agent 接一个向量库”,而应该被理解成...
很多人第一次评估 Codex CLI 这类终端 AI 编码工具时,会把注意力集中在两个问题上:它生成代码快不快、回答问题准不准。这两个问题当然重要,但一旦准备把...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市