上一篇文章我们聊了 WorkBuddy 的诞生背景和技术本质,知道了它不是简单的 OpenClaw 套壳,而是一个 AI 原生的办公操作系统。今天我们来深入拆解 WorkBuddy 的核心技术架构,看看它到底是怎么实现 "一句话自动化办公" 这个神奇功能的。
很多技术文章讲架构的时候,都喜欢画一堆复杂的框图,用一堆晦涩的术语,把简单的事情讲得特别复杂。今天我不这么干。我会用最通俗的语言,把 WorkBuddy 的架构讲得明明白白,让即使不是程序员的朋友也能听懂。
如果用一个词来概括 WorkBuddy 的整个架构设计,那就是:解耦。而其中最核心、最关键的一个解耦,就是 "底座与上层应用分离"。
WorkBuddy 和腾讯云 CodeBuddy、腾讯 QClaw 共享同一套 AI Agent 底层底座。这套底座是腾讯从 2023 年开始研发的,经过了 CodeBuddy 三年的内部验证和 QClaw 百万用户的外部验证,已经非常成熟和稳定。
同源底座的好处是显而易见的:
第一,技术复用。三个产品共享同一套核心技术,避免了重复开发,大大降低了研发成本。腾讯在 AI Agent 领域的所有技术积累,都可以同时赋能三个产品。
第二,能力互通。三个产品之间的能力是可以互通的。比如,CodeBuddy 的代码能力可以无缝集成到 WorkBuddy 中,QClaw 的远程操控能力也可以无缝集成到 WorkBuddy 中。用户不需要在不同的产品之间来回切换,就可以使用所有的能力。
第三,统一生态。三个产品共享同一个技能生态和同一个模型生态。开发者只需要编写一次技能,就可以同时在三个产品上运行。用户只需要配置一次大模型,就可以同时在三个产品上使用。
在同源底座的基础上,WorkBuddy 又做了严格的分层解耦。整个系统从下到上分为五层:基础设施层、智能体底座层、能力服务层、业务应用层和用户交互层。
每一层都只和它相邻的层通信,不跨层调用。每一层都有自己明确的职责,不做超出自己职责范围的事情。这样的设计,让系统的可维护性和可扩展性大大提高。如果某一层需要升级或者替换,不会影响到其他层的正常运行。
现在我们一层一层来看,每一层都包含哪些组件,分别负责什么工作。
基础设施层是整个系统的基石,它为上层提供最基础的运行环境和服务。
WorkBuddy 的基础设施层分为两部分:云端基础设施和本地基础设施。这对应了 WorkBuddy 的云端沙箱和本地执行双模式。
云端基础设施部署在腾讯云上,包括计算资源、存储资源、网络资源、数据库、消息队列等等。它主要负责云端沙箱模式下的任务执行、模型调度、数据存储和消息转发。
本地基础设施就是用户的电脑。WorkBuddy 会在用户的电脑上创建一个独立的运行环境,包括 Python 解释器、各种第三方库、浏览器驱动等等。它主要负责本地模式下的任务执行、文件操作和软件调用。
这种 "云端 + 本地" 的混合基础设施架构,是 WorkBuddy 的一大特色。它兼顾了云端的算力优势和本地的数据安全优势。用户可以根据任务的敏感程度,灵活选择是在云端执行还是在本地执行。
智能体底座层是整个系统的心脏,所有的 AI 能力都来自这一层。它继承自 CodeBuddy 的智能体内核,包含了四个核心组件:自然语言理解器、任务规划器、工具调用器和执行监控器。
自然语言理解器负责把用户的自然语言指令转换成系统能理解的结构化表示。它不仅能理解指令的字面意思,还能结合上下文和用户历史,理解指令的隐含意思。比如,用户说 "把那个文件发给我",自然语言理解器会根据上下文,知道 "那个文件" 指的是哪个文件。
任务规划器负责把一个复杂的大任务,逐层拆解成一个个简单的、可执行的子任务。它采用了 "分层拆解 + 动态调整" 的策略,会在执行过程中根据实际情况,动态地调整任务的步骤。如果遇到不确定的情况,它会停下来,向用户确认。
工具调用器负责调用各种工具来执行具体的任务。它统一管理所有的工具,包括内置工具、技能工具和第三方工具。它会根据任务的类型,自动选择最合适的工具,并把任务参数传递给工具。
执行监控器负责监控任务的执行过程,处理执行过程中出现的各种异常情况。如果某个步骤执行失败了,它会分析失败的原因,然后采取相应的措施:自动重试、重新规划任务、或者向用户报告错误。
这四个组件协同工作,共同构成了一个完整的 AI Agent 闭环。
能力服务层是连接智能体底座和上层业务应用的桥梁。它把智能体底座的核心能力,封装成了一个个独立的、可复用的能力服务。
WorkBuddy 的能力服务层主要包括以下几个服务:
每个能力服务都是一个独立的微服务,可以单独部署和升级。上层业务应用只需要调用这些服务的接口,就可以使用相应的能力,不需要关心底层的实现细节。
业务应用层是 WorkBuddy 的核心功能层。它基于能力服务层,构建了各种面向具体办公场景的业务应用。
WorkBuddy 内置了 20 多个业务应用,也就是我们常说的技能包。比如:
这些业务应用都是经过腾讯内部数千名员工验证过的生产级应用,稳定性和实用性都非常高。用户不需要任何配置,安装完 WorkBuddy 就能直接使用。
除了内置的业务应用,能力服务层还支持第三方开发者开发自己的业务应用。开发者可以利用 WorkBuddy 提供的 SDK,快速开发出适合自己企业的定制化应用。
用户交互层是用户和 WorkBuddy 打交道的地方。WorkBuddy 的设计理念是 "让 AI 来找你,而不是你去找 AI"。所以它没有自己独立的主界面,而是完全融入到用户已经习惯的办公工具中。
WorkBuddy 支持五种用户交互方式:
这种多入口的交互方式,让用户可以在任何地方、任何工具中使用 WorkBuddy。不需要切换应用,不需要学习新的操作,只要会发消息,就能用 WorkBuddy。
WorkBuddy 最独特的技术设计之一,就是它支持云端沙箱和本地执行双模式,并且可以无缝切换。
什么是云端沙箱模式?什么是本地执行模式?它们分别适用于什么场景?
云端沙箱模式,就是所有的任务都在腾讯云的隔离沙箱中执行。用户的电脑只负责发送指令和接收结果,不参与任何计算和执行过程。
云端沙箱模式的优势是:
第一,不受本地设备限制。无论你的电脑性能如何,都可以处理非常复杂的任务。因为所有的计算都在云端完成,云端可以提供无限的算力。
第二,支持定时任务和后台任务。即使你的电脑关机了,云端的任务也会继续执行。你可以设置一个任务在晚上 12 点执行,第二天早上上班的时候,结果已经准备好了。
第三,数据隔离。每个用户的沙箱都是完全隔离的,不同用户之间的数据不会互相干扰。而且,沙箱中的数据会在任务完成后自动删除,不会长期存储。
云端沙箱模式适合处理非敏感的、需要大量算力的、或者需要定时执行的任务。比如,搜集行业资讯、生成市场报告、发送定时邮件等等。
本地执行模式,就是所有的任务都在用户的本地电脑上执行。腾讯云的服务器只负责转发指令和结果,不参与任何计算和执行过程。
本地执行模式的优势是:
第一,数据安全。所有的数据都存储在用户的本地电脑上,不会上传到任何云端服务器。这对于处理敏感数据来说,是至关重要的。
第二,速度更快。不需要把大文件上传到云端,也不需要等待云端的计算结果。所有的操作都在本地完成,速度要快得多。
第三,可以访问本地资源和内网资源。本地执行模式下,WorkBuddy 可以访问用户电脑上的所有文件,可以访问企业内部的网络和系统。这是云端沙箱模式做不到的。
本地执行模式适合处理敏感的、涉及本地文件和内网资源的任务。比如,整理公司内部的财务数据、审查商业合同、操作企业内部的 ERP 系统等等。
WorkBuddy 会根据任务的类型,自动选择最合适的运行模式。用户也可以手动指定运行模式。而且,在任务执行过程中,用户还可以随时切换运行模式。比如,一个任务一开始在本地执行,执行到一半的时候,用户发现需要大量的算力,就可以把任务切换到云端沙箱继续执行。
这种无缝切换的能力,是 WorkBuddy 独有的。其他的 AI Agent 产品,要么只能在云端运行,要么只能在本地运行,不能同时支持两种模式,更不能无缝切换。
同源底座与分层解耦的架构,加上云端 + 本地双模式运行机制,给 WorkBuddy 带来了很多优势,但也带来了一些挑战。
先说说优势:
第一,极高的稳定性和可靠性。智能体底座经过了三年的内部验证和百万用户的外部验证,已经非常成熟和稳定。分层解耦的设计,让单个组件的故障不会影响到整个系统的运行。
第二,极强的可扩展性。如果需要增加新的能力,只需要在能力服务层增加一个新的服务即可。如果需要增加新的业务应用,只需要基于现有的能力服务进行开发即可。不需要修改底层的智能体底座。
第三,极致的灵活性。用户可以根据自己的需求,灵活选择运行模式、交互方式、大模型和技能。WorkBuddy 不会强迫用户使用任何特定的功能或服务。
第四,优秀的企业级特性。WorkBuddy 从设计之初就考虑了企业的需求,提供了集中管理、权限控制、操作审计、数据安全等一系列企业级特性。这是其他个人级 AI Agent 产品所不具备的。
再说说挑战:
第一,架构复杂度高。分层解耦的设计虽然提高了可扩展性,但也增加了系统的复杂度。需要更多的开发和维护人员,也更容易出现兼容性问题。
第二,数据一致性问题。在双模运行模式下,数据会在云端和本地之间流动。如何保证云端和本地数据的一致性,是一个比较棘手的问题。
第三,性能开销问题。分层解耦的设计会带来一定的性能开销。虽然对于大多数办公任务来说,这点性能开销可以忽略不计,但对于一些对性能要求极高的任务,还是会有一定的影响。
这些挑战都是可以解决的。随着技术的不断发展和产品的不断迭代,这些问题都会逐步得到解决。
nullClaw.Kuaisou.cOm
obsidian.Kuaisou.cOm
openfang.Kuaisou.cOm
openrooM.Kuaisou.cOm
operator.Kuaisou.cOm
piCoClaw.Kuaisou.cOm
nemoClaw.Kuaisou.cOm
tinyClaw.Kuaisou.cOm
tuyaClaw.Kuaisou.cOm
workbuddy.Kuaisou.cOm
WorkBuddy 的架构设计,体现了腾讯云一贯的务实和稳健的工程风格。它没有追求技术上的花哨,而是从企业用户的实际需求出发,用最成熟、最可靠的技术,解决了企业办公 AI 最核心的问题。
同源底座与分层解耦的设计,让 WorkBuddy 拥有了极强的可维护性和可扩展性。云端 + 本地双模式运行机制,让 WorkBuddy 兼顾了算力和安全,满足了不同场景的需求。多入口的交互方式,让 WorkBuddy 完全融入了用户现有的工作流,实现了 "无感使用"。
当然,现在的 WorkBuddy 架构还不是最终形态。随着产品的不断发展,它还会不断地演进和完善。但我相信,同源底座与分层解耦这个核心设计,会一直保留下去。因为它是目前为止,最适合企业级 AI Agent 的架构。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。