首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!

谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!

作者头像
开源星探
发布2026-03-16 20:12:07
发布2026-03-16 20:12:07
5680
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年

过去两年,我们几乎默认了一件事:

人和 AI 的交互就只能靠文本框和语音。

不管是 GPT、DeepSeek、Claude,还是各种音视频 Agent,核心入口几乎清一色是一个聊天框。

但只要你真正做过 AI 应用,就会很快发现一个现实问题:

  • • 真实任务往往不是一句话能完成的
  • • 用户输入经常不完整、不规范、缺关键信息
  • • 单靠「再问一句」对话,体验很容易崩。

比如这些场景:

  • • 订机票要选日期、舱位、乘客
  • • 填订单要地址、手机号、发票信息
  • • 企业客服要订单号、时间范围、商品规格

你让用户靠「多轮对话」一点点补齐这些结构化信息,显然即使能顺利执行下来,步骤及体验也是相当差的。

Google 开发团队显然也意识到了这一点。就在这两天,他们开源了 A2UI

它并不是一个“UI 框架”,而是一种基于代理的接口协议,负责 AI Agent 和用户界面之间的中间层协议与实现。

而核心目标就是让 Agent 能够使用 GUI(图形用户界面)与人类交流,就像它使用自然语言一样自然。

主要原理

A2UI,让 AI 用 JSON 描述 UI,由客户端原生渲染交互界面。

是的,它的核心主张就是这个,声明式 JSON

AI 不用写什么前端代码,只输出「我需要什么 UI」即可。

以下是一个简化的 JSON 消息示例(定义用户界面):

代码语言:javascript
复制
{
  "surfaceUpdate": {
    "surfaceId": "main",
    "components": [
      {
        "id": "header",
        "component": {
          "Text": {
            "text": {"literalString": "Book Your Table"},
            "usageHint": "h1"
          }
        }
      },
      {
        "id": "date-picker",
        "component": {
          "DateTimeInput": {
            "label": {"literalString": "Select Date"},
            "value": {"path": "/reservation/date"},
            "enableDate": true
          }
        }
      },
      {
        "id": "submit-btn",
        "component": {
          "Button": {
            "child": "submit-text",
            "action": {"name": "confirm_booking"}
          }
        }
      },
      {
        "id": "submit-text",
        "component": {
          "Text": {"text": {"literalString": "Confirm Reservation"}}
        }
      }
    ]
  }
}

它定义了界面的 UI 组件:文本标题、日期选择器和按钮。

AI 只关心意图和结构,而不是 UI 细节。

还有一个关键核心:客户端原生渲染(安全关键)

UI 不是 AI 直接生成 HTML/JS,而是:客户端 + 用受控组件库 + 再根据 JSON 渲染。

这样做的好处是:

  • • 安全(避免注入)
  • • 风格统一
  • • 移动端/Web/桌面端一致
  • • 可控权限和交互逻辑

这也是 A2UI 能适应企业级场景的关键。

A2UI 能力一览

1、Widget Gallery:现成可用的交互组件库

A2UI 自带一个 Widget Gallery,包含大量常用 UI 小部件:

  • • 表单输入
  • • 日期选择
  • • 下拉选项
  • • 状态展示

所有组件:

  • • 都有现成示例
  • • 支持直接使用或二次定制
  • 界面与源码可实时切换查看

这点对开发者非常友好。

2、Material Icons:开箱即用的设计语言

内置 100 个常用 Material Icons,保证:

  • • 风格统一
  • • 不用额外处理设计资源

3、基于 CopilotKit,天然适合 AI 系统

A2UI 构建在 CopilotKit 之上,因此天然支持:

  • • 聊天式交互
  • • AI 生成内容
  • • Agent 驱动 UI 更新

这让它非常适合用在:

“对话 + 操作 + 界面”混合型 AI 系统

快速入手

环境要求:Node.js(版本>=18)、Gemini API

克隆代码

代码语言:javascript
复制
git clone https://github.com/google/a2ui.git
cd a2ui

设置API密钥

代码语言:javascript
复制
export GEMINI_API_KEY="your_gemini_api_key_here"

切换目录至 Lit Client

代码语言:javascript
复制
cd samples/client/lit

安装运行

代码语言:javascript
复制
npm install
npm run demo:all

最后打开 http://localhost:5173 就能在浏览器中看到网页应用。

在网页应用中,尝试以下提示:

  • • “预订一张两人桌” ——观看客服人员生成预订表格
  • • “查找附近的意大利餐厅” - 查看动态搜索结果
  • • “你们的工作时间是什么时候?” - 体验针对不同意图的不同用户界面布局。

其幕后执行流程:

  • • 首先通过网页用户界面发送消息。
  • • A2A代理收到对话后,会将对话内容发送给Gemini。
  • • Gemini 生成描述用户界面的 A2UI JSON 消息。
  • • A2A代理会将这些消息流式传输回Web应用程序。
  • • A2UI渲染器将它们转换为原生Web组件
  • • 最后在浏览器中看到渲染后的用户界面。
写在最后

A2UI 传递出的一个强烈信号:未来的 AI 系统,交互不再只有「说话」,而是「会生成界面」。

这意味着:

  • • AI 不只是回答问题
  • • 而是能主动设计“如何与人协作”

从这个角度看,A2UI 解决的,并不是 UI 好不好看,而是一个更底层的问题:

复杂任务,应该如何让 AI 和人高效协作?

当 Agent 能根据任务需要,动态生成最合适的交互界面,很多原本“只能 Demo”的 AI 应用,才真正有机会进入生产环境。

如果你正在做 AI Agent、智能客服或企业 AI 系统,这个项目,非常值得你花时间研究一下。

GitHub:https://github.com/google/a2ui

如果本文对您有帮助,也请帮忙点个 赞👍 + 在看 哈!❤️

在看你就赞赞我!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-12-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源星探 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 主要原理
  • A2UI 能力一览
  • 快速入手
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档