
这几天我深度体验 OpenClaw,最大感受是权限开放度极高:几乎所有操作都能直接在 Dashboard 通过自然语言交互完成,例如查看 Skill 目录路径、调试工具链等。不过官方文档篇幅较长,完整掌握仍需投入时间。
目前我主要通过企业微信驱动 Agent 构建情报挖掘系统:基于自定义 Skill,结合 MiniMax M2.5 的推理能力,定时完成信息采集、清洗与分析闭环。

而支撑这一切的核心,正是 OpenClaw 的网关架构 —— 它如同数字世界的神经中枢,能将各类设备与系统无缝接入统一的 AI 协作网络。

在 OpenClaw(原名 Maltbot/Clawdbot)的架构中,网关(Gateway) 既是中枢神经,也是整套系统的灵魂。如果你想从 0 到 1 复刻一个类似的个人 AI 助理系统,读懂网关的实现逻辑是第一步。
我们将网关拆解为 6 个核心维度,并附上可直接作为 Prompt 的技术指令。
实现逻辑: 网关在单一端口(默认 18789)上同时跑着两种通信协议:WebSocket 和 HTTP。
💡 小白例子: 想象网关是一个全能柜台。你既能跟柜员实时聊天(WS),也可以往柜台信箱里塞一个自动填表的申请单(HTTP Webhook)。
实现逻辑: 为了保证数据不错乱,网关使用 TypeBox 定义了一套严密的 JSON 架构。
connect,否则网关会直接关门(断开连接)。💡 小白例子: 就像进电梯要按楼层。如果你进门不说话也不按楼层,电梯安全系统会觉得你很可疑,直接把你踢出去。
实现逻辑: 网关通过连接时的声明区分角色(Roles):
💡 小白例子: 管家(网关)点名时,确认你是“发号施令的主人”,还是“负责拍照的保镖”。

实现逻辑: 网关不让 AI 模型决定回复渠道。它会记录每条入站消息的 SessionKey(会话键)。
💡 小白例子: 就像送快递。包裹上贴了回执单,不管里面的东西是谁做的(AI 思考),包裹最后一定会退回到发件地址。
实现逻辑: 既然网关能控制电脑,安全就是生命线。
💡 小白例子: 就像你家指纹锁。第一次录入(配对)必须用备用钥匙(手动审批),之后指纹(令牌)才管用。
实现逻辑: 网关不只是被动响应,它有“自愈”和“预警”能力。
💡 小白例子: 就像保姆。每天 7 点准时叫你起床(Cron),并且每隔半小时巡视一圈厨房看火灭没灭(Heartbeat)。

你可以将以下内容直接输入 ChatGPT/Claude,生成网关的初步代码框架:
Role: 资深分布式系统架构师。
Task: 基于 TypeScript 和 Node.js 生成一个 AI Agent 网关的核心框架代码。
Requirements:
connect 握手逻辑,支持 operator 和 node 两种角色。 node 连接时需声明能力(capabilities)。Map<sessionKey,connection> 映射,实现“确定性路由”逻辑,确保响应能原路返回。deviceId 和 deviceToken 验证。Heartbeat 接口,支持每隔 N 分钟自动触发一次特定的 AI Agent 处理逻辑。Output Style: 代码需模块化,包含清晰的接口定义和注释。
Mixlab: 真正的个人助理不应是一个网页窗口,而是一个运行在你掌控之下的网关。通过把“大脑(模型)”与“感官(节点)”解耦,我们才真正拥有了数字世界的自由。