用户12029797

文章/答案/技术大牛

发布

LV2

发表了文章 19小时前2026-07-02 12:16:08

OpenHands 能运行 Coding Agent，但第一步是限定它能碰什么

OpenHands 不是“仓库旁边再放一个聊天框”。它更像一个 AI 开发控制面：前端、app server、sandbox service、代码托管集成、sk...

用户12029797 19小时前2026-07-02 12:16:07

人工智能

发表了文章 1天前2026-07-01 11:05:05

Serena 能给 Agent 语义代码工具，但第一步是确认项目边界

Serena 有价值，是因为它让 AI coding host 不只是靠全文搜索、文件拼接和模型猜测来理解代码。它通过 MCP 暴露语义代码工具，让 Claud...

用户12029797 1天前2026-07-01 11:05:05

人工智能

发表了文章 2天前2026-06-30 11:37:13

FastMCP 很快，但第一步不是把所有函数都暴露成工具

FastMCP 的吸引力很直接：你写一个普通 Python 函数，加上 mcp tool decorator，它就可以变成 MCP 客户端能发现和调用的工具。对...

用户12029797 2天前2026-06-30 11:37:13

人工智能

发表了文章 3天前2026-06-29 11:06:46

smolagents 真正强的地方是代码型行动，但第一步不是放权

smolagents 吸引人的地方，不只是“几行代码就能跑 agent”。更关键的是它支持 CodeAgent：agent 可以用 Python 代码表达行动，...

用户12029797 3天前2026-06-29 11:06:46

人工智能

发表了文章 4天前2026-06-28 18:29:36

不要把 browser-use 当成“会点网页的模型”：先给浏览器 Agent 设计执行契约

我最近越来越不愿意把浏览器 Agent 叫成“自动点网页”。这个说法太轻了。真正的风险不在于它能不能点按钮，而在于它能不能在一个真实账号、真实网页、真实失败状态...

用户12029797 4天前2026-06-28 18:29:36

人工智能

发表了文章 5天前2026-06-27 16:05:30

不要把 Pydantic AI 当成 Agent 魔法层：先写清工具权限和输出合同

Pydantic AI 最容易被误读成“又一个 Python Agent 框架”。这个理解不算错，但太粗了。它真正适合的场景不是把一个 prompt 包成 Ag...

用户12029797 5天前2026-06-27 16:05:30

人工智能

发表了文章 6天前2026-06-26 11:26:21

别等 Agent 上线后补评估：先用 DeepEval 写失败样本

很多团队接入 AI Agent、RAG 或客服机器人时，最容易晚一步做的事情就是评估。先把模型、prompt、工具调用、RAG 检索串起来，等 demo 能跑，...

用户12029797 6天前2026-06-26 11:26:21

人工智能

发表了文章 7天前2026-06-25 10:47:46

给 Agent 接入 Qdrant 前，先写清楚检索合同

很多人把向量数据库接到 Agent 里时，第一反应是“把 embedding 存进去，再让模型查”。这条路能跑起来，但也很容易把问题藏起来：Agent 查到的东...

用户12029797 7天前2026-06-25 10:47:46

人工智能

发表了文章 8天前2026-06-24 11:48:48

让 Agent 用 E2B 跑代码前，先写清楚沙箱合同

E2B 很容易被一句话讲成“给 AI Agent 一个安全沙箱，让它可以跑代码”。

用户12029797 8天前2026-06-24 11:48:48

人工智能

发表了文章 9天前2026-06-23 15:24:49

别把 LangGraph 当成更长的 Chain：先把状态、打断和恢复路径写清楚

很多人第一次看 LangGraph，会把它理解成“更复杂一点的 LangChain”。这个理解容易把重点带偏。

用户12029797 9天前2026-06-23 15:24:49

人工智能

发表了文章 10天前2026-06-22 17:40:54

不要上线后才补 LLM 评测：用 promptfoo 先定义失败边界

很多团队把 LLM eval 当成“上线以后再慢慢补”的事情。这个顺序通常会带来一个问题：等系统已经接入真实用户、真实工具和真实预算以后，再去讨论“什么算失败”...

用户12029797 10天前2026-06-22 17:40:54

人工智能

发表了文章 10天前2026-06-22 15:50:50

不要等 LLM 工作流上线后再补 eval：promptfoo 最该先定义的是失败边界

很多团队接入 LLM 应用时，会先把 prompt 调顺，再补一个“评测脚本”。这个顺序很容易出问题：等到线上开始失败时，大家才发现自己没有定义过什么叫通过、什...

用户12029797 10天前2026-06-22 15:50:50

人工智能

发表了文章 11天前2026-06-21 21:34:05

给 AI Agent 加记忆之前，先决定它到底允许记住什么

这也是我阅读 Doramagic 的 agent-memory manual 时认为最重要的点：它不应该被理解成“给 Agent 接一个向量库”，而应该被理解成...

用户12029797 11天前2026-06-21 21:34:05

AI Agent安全网关、人工智能、开源

发表了文章 2026-05-262026-05-26 13:33:31

把 Codex CLI 接进真实仓库：从权限矩阵到回滚事件的工程控制面

很多人第一次评估 Codex CLI 这类终端 AI 编码工具时，会把注意力集中在两个问题上：它生成代码快不快、回答问题准不准。这两个问题当然重要，但一旦准备把...

用户12029797 2026-05-262026-05-26 13:33:31

AIGC

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2026-02-01

个人成就

获得 9 次赞同
文章被阅读 1.4K 次

关注了：0关注者：12

用户12029797

OpenHands 能运行 Coding Agent，但第一步是限定它能碰什么

Serena 能给 Agent 语义代码工具，但第一步是确认项目边界

FastMCP 很快，但第一步不是把所有函数都暴露成工具

smolagents 真正强的地方是代码型行动，但第一步不是放权

不要把 browser-use 当成“会点网页的模型”：先给浏览器 Agent 设计执行契约

不要把 Pydantic AI 当成 Agent 魔法层：先写清工具权限和输出合同

别等 Agent 上线后补评估：先用 DeepEval 写失败样本

给 Agent 接入 Qdrant 前，先写清楚检索合同

让 Agent 用 E2B 跑代码前，先写清楚沙箱合同

别把 LangGraph 当成更长的 Chain：先把状态、打断和恢复路径写清楚

不要上线后才补 LLM 评测：用 promptfoo 先定义失败边界

不要等 LLM 工作流上线后再补 eval：promptfoo 最该先定义的是失败边界

给 AI Agent 加记忆之前，先决定它到底允许记住什么

把 Codex CLI 接进真实仓库：从权限矩阵到回滚事件的工程控制面

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐