首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ChatGPT 推出「直接结账」功能,智能体开始替你「剁手」消费

ChatGPT 推出「直接结账」功能,智能体开始替你「剁手」消费

作者头像
不二小段
发布2026-04-09 18:33:55
发布2026-04-09 18:33:55
1110
举报
文章被收录于专栏:不二小段不二小段

许多年前,互联网是一个新奇的所在。人们相信它是一座无穷无尽的图书馆,一个信息乌托邦。它的许诺是连接与知识。然后,横幅广告出现了。再然后,我们有了电商。图书馆变成了购物中心,我们从「信息冲浪者」变成了「购物消费者」。

如今,历史的齿轮再次转动,只是这一次,购物车的导购员有了点未来科技的味道。

在 DeepSeek 和 Anthropic 忙着更新模型的时候,OpenAI 却推出了「Instant Checkout」(直接结账)功能。

这是一个内嵌在 ChatGPT 里的购物按钮,由一套名为「智能体商业协议」(Agentic Commerce Protocol, ACP)的开放标准驱动。

举个例子,你在和 ChatGPT 聊天,问它「送给喜欢陶艺的朋友什么礼物好」,它不仅会给你建议,还会直接展示来自 Etsy 或者 Shopify 商家的商品,旁边附一个「购买」按钮。点一下,确认信息,交易完成,你甚至不需要离开聊天窗口。

一个什么都能聊的 AI,为什么不能顺便卖点东西呢? 但这就像在说,一个能索引全世界网页的搜索引擎,为什么不能顺便卖点广告位呢?

ACP:智能体电商协议

让我们先放下那些关于 AGI 和人类未来的宏大叙事,拆解一下这个所谓的「智能体商业协议」(ACP)。

OpenAI 和他们的合作伙伴 Stripe 说,这是一个开放、灵活、安全、易于接入的标准。听起来很美,就像所有科技公司发布新「标准」时说的一样。

其实这套协议就是试图在智能体、用户、商家和支付平台之间找到一个微妙的平衡点,让大家都愿意接入使用。

ACP 的核心是让一个 AI 智能体(比如 ChatGPT)能够代表用户,与商家的系统进行结构化的对话来完成一笔交易。这套协议基本上由三份相互关联的技术规格组成:

1. 产品供给规格 (Product Feed Spec)

这可以理解为商家为 AI 准备的一份标准化的「商品说明书」。商家需要按照这个规格,将自己的商品信息打包成一个结构化的数据源(可以是 TSV, CSV, XML, 或 JSON 格式),并通过一个加密的 HTTPS 连接提供给 OpenAI。

这份「Feed」包含了 AI 理解商品所需的一切关键信息:唯一的商品 ID、详尽的描述、清晰的价格、实时的库存、多媒体文件链接、以及可用的配送选项等。

这份规格的关键在于 实时性。协议要求商家能支持高频更新,频率可以高达每 15 分钟一次。 这对于电商至关重要,因为价格和库存瞬息万变。一个不能实时反映库存的智能体推荐,只会带来糟糕的用户体验。因此,这份规格不仅是静态的数据交换,更是一种动态的信息同步机制。

2. 智能体结账规格 (Agentic Checkout Spec)

这是整个协议的交互核心,定义了一系列的 RESTful API 终端和 Webhooks,构成了智能体与商家后端系统之间的「对话」语言。整个结账流程并非一次性的请求,而是一个 状态驱动(State-driven) 的会话过程。

  • 会话创建与状态机: 当用户在 ChatGPT 中点击「购买」时,智能体并不会立刻下单。相反,它会调用商家实现的 POST /agentic_commerce/checkout_sessions 之类的 API,创建一个结账会话(Checkout Session)。这个会话是一个状态机,包含了诸如 createdshipping_info_providedpayment_pendingcompletedfailed 等状态。
  • 结构化状态的传递: 智能体与商家之间的每一次交互,都会返回一个富含信息的结账状态对象(rich checkout state)。这个对象详细描述了当前的购物车内容、运费、税费、可选的配送方式等。ChatGPT 的前端 UI 就是根据商家返回的这个状态对象来渲染的。用户在界面上做出的任何选择(比如更换收货地址或选择不同的快递),智能体都会再次调用商家的 API(例如 PUT /agentic_commerce/checkout_sessions/{session_id})来更新会话状态,并接收一个新的状态对象来刷新 UI。
  • 商家掌握控制权: 整个过程中,所有核心的商业逻辑——比如库存验证、地址有效性检查、运费和税费的精确计算、支付风险信号分析——全部在商家自己的后端系统中完成。 OpenAI 的智能体只负责传递信息和渲染 UI,它不参与核心决策。商家拥有完全的权力,可以根据自己的风控模型和业务规则来接受或拒绝一笔订单。
  • Webhooks 异步通信: 订单完成后,很多事情是异步发生的,比如发货、退款、取消。为此,规格定义了 Webhooks 机制。商家系统在订单状态发生变化时(如 order_createdorder_updated),会主动向 OpenAI 的一个端点发送通知。 为了安全,这些通知必须带有 HMAC 签名,以验证其来源确实是该商家。

3. 委托支付规格 (Delegated Payment Spec)

这是处理资金的部分,也是安全设计的重中之重。为了避免 OpenAI 自己处理和存储用户的完整信用卡信息(从而陷入 PCI DSS 合规的噩梦),ACP 设计了一套委托支付流程。

  • 支付令牌化(Tokenization): 当用户输入支付信息时,ChatGPT 作为一个可信的 UI,会将这些敏感数据直接发送给用户信任的支付服务提供商(PSP),比如 Stripe。它不会在自己的服务器上长久存储这些信息。
  • 创建委托支付请求: OpenAI 向 PSP 发起一个一次性的「委托支付请求」。这个请求有严格的限制,包括一个 最高可扣款金额 和一个 过期时间。 这确保了即使用户授权,这笔支付也不能被用于其他金额或在未来被滥用。
  • 安全的令牌传递: PSP 验证支付信息后,会将其安全地存储在自己的 vault 中,并返回一个一次性的支付令牌(Payment Token)给 OpenAI。这个令牌本身不包含敏感信息。
  • 商家完成扣款: OpenAI 随后将这个支付令牌连同结账会话信息一起,传递给商家的后端。商家再用这个令牌,通过自己与 PSP 的集成来完成最终的扣款操作。Stripe 将这种专为该场景设计的令牌称为「共享支付令牌」。

从技术细节上看,ACP 的设计哲学是「关注点分离」。

OpenAI 负责它最擅长的人机交互和智能体逻辑,商家保留了他们赖以生存的商业流程和客户关系,而支付的专业性和安全性则交给了 Stripe 这样的专业 PSP。

总体来说,这确实是一个可落地且可扩展的架构。

为什么是现在?为什么是电商?

OpenAI 为什么要在这个时间点,搞出一个电商协议?答案可能和他们「造福全人类」的宏伟愿景关系不大,而与更世俗的东西有关:

众所周知,OpenAI 是一家极度烧钱的公司。训练和运行大型语言模型的成本是天文数字。虽然他们通过 ChatGPT Plus 订阅和 API 调用获得了可观的收入,但距离实现盈利,甚至仅仅是覆盖其高昂的研发和运营成本,都还有很长的路要走。

微软的投资可以支撑一时,但投资人终究需要看到一条清晰、宽广、能够产生巨额现金流的商业化路径。

订阅模式的天花板是可见的,而 API 的收入则依赖于开发者生态的繁荣。

这两者都很好,但可能还不够好,不够快。

那么,什么商业模式在互联网历史上被证明最成功、最能印钞?答案只有两个:广告和电商抽佣。

OpenAI 选择了后者,或者说,一个更高级的混合体。他们很聪明地没有称之为「广告」,而是「一种全新的购物体验」。他们反复强调:

商品结果是有机的、非赞助的,纯粹根据与用户的相关性进行排名。

商家支付少量成交费用,但服务对用户免费,不影响商品价格,也不会影响 ChatGPT 的商品结果。

这些话术听起来是不是很耳熟?如果你经历过 2000 年代初互联网的人,就会感到一种强烈的既视感。这几乎就是 Google 创业初期的翻版。

1998 年,当谢尔盖·布林和拉里·佩奇还在斯坦福大学时,他们在描述 Google 原型的那篇著名论文中,写下了这样一段话:

我们认为,广告问题会引发足够的动机混杂……我们预计,由广告资助的搜索引擎将天生偏向广告商,而非消费者的需求。

历史充满了讽刺。后来的故事我们都知道了。Google 最终成为了人类历史上最强大的广告公司。

那些曾经被认为会「侵蚀商业模式」的有机结果,被不断挤压,屏幕的首屏越来越多地让位给付费链接。这并非出于恶意,而是一种商业模式的必然。当你的绝大部分收入依赖于广告点击时,你的系统就会不可避免地优化那些最能促进点击的行为,而不是提供最纯粹信息的行为。

现在,OpenAI 站在了同样的十字路口。

他们宣称排名「纯粹基于相关性」,但又补充了一句,在对销售相同商品的不同商家进行排名时,会考虑「可用性、价格、质量……以及 是否启用了 Instant Checkout」等因素来「优化用户体验」。

看到那个小小的后门了吗?这为未来的「优化」留下了充足的解释空间。当 Instant Checkout 带来的收入成为 OpenAI 财报上的重要支柱时,谁能保证算法的天平不会向那些能带来收入的商家倾斜?

这就是平台「劣化」(Enshittification)的过程。(外网网友其实更直接,把这个词理解为「屎化」)。

平台一开始为用户提供价值,吸引用户。然后为商家提供价值,吸引商家。最后,当双方都被锁定后,平台开始将价值从用户和商家那里榨取出来,输送给股东。

OpenAI 只是在重走这条所有前辈都走过的路。

入口之战:互联网的下一片高地

从更宏大的视角看,这不仅仅是 OpenAI 的一次商业化尝试,更是对互联网下一个核心入口的争夺。

上一代的互联网入口是「搜索框」。 Google 通过定义这个入口,统治了信息分发,并从中攫取了巨额利润。你想要知道什么、找到什么、买到什么,第一站都是 Google。

AI 时代,新的入口正在浮现,那就是「对话框」。人们越来越习惯于通过自然语言与 AI 交流来获取信息、解决问题。如果这个对话框成为人们上网的起点,那么谁控制了这个对话框,谁就控制了未来的流量分配和商业流向。

这才是 OpenAI 的真正野心,也是 Google、Meta、苹果等所有巨头都感到恐惧的地方。

如果用户习惯于在 ChatGPT 里完成从信息查询到商品购买的全流程,他们就不再需要打开 Google 搜索,也不需要打开亚马逊 App。

整个互联网的价值链将被重构。

OpenAI 推出 ACP,就是在为这个未来铺设基础设施。 他们联合支付巨头 Stripe,拉拢电商平台 Shopify 和 Etsy,试图打造一个「AI 商业」的新生态。

这个生态以 OpenAI 的模型为中心,ACP 是连接万物的标准协议。这是一种典型的平台战略:制定标准,构建生态,然后坐收佣金。

有趣的是,就在之前,Google 也宣布了他们自己的智能体支付协议——Agent Payment Protocol (AP2)。

这场战争已经从模型能力的军备竞赛,蔓延到了商业生态的标准之争。谁的协议能吸引更多的商家和开发者,谁就更有可能赢得这场入口之战。

用户的信任与智能体的困境

在这场商业博弈中,有一个角色似乎被选择性地简化了,那就是用户。

科技公司的产品经理们总是痴迷于「无摩擦体验」(frictionless experience)。他们认为,用户最想要的就是用最少的步骤完成最多的事情。亚马逊的「一键下单」专利就是这一理念的巅峰。

然而,这种理念在某些场景下是危险的。尤其是在花钱这件事上,一点「摩擦」往往是必要的。它给了我们思考和反悔的时间。

亚马逊的 Alexa 语音助手在商业上的失败就是一个很好的例子。很多人家里都有 Echo 设备,但几乎没人用它来购物。让一个语音助手下单买东西,总感觉不那么踏实。因为购物不仅仅是一个简单的指令执行,它涉及到浏览、比较、感受、冲动和犹豫,是一个复杂的决策过程。

现在,OpenAI 想让我们把这种信任交给一个以「一本正经地胡说八道」而闻名的 AI。

我们都知道 ChatGPT 会犯错,会编造事实。当我们让它总结一篇论文时,这可能只是个麻烦。但如果它在下单时搞错了数量、颜色、甚至是商品本身呢?大模型的幻觉在现实中可能是一场金融灾难。

另一方面,「智能体商业」(Agentic Commerce)这个名字本身就充满了歧义。

这里的「智能体」(Agent)究竟是谁的智能体?

理论上,它应该是用户的个人购物助理,忠实地执行用户的指令。但在一个由商家支付佣金的商业模式中,这个智能体很难不被诱惑去服务那些付费的商家。它的推荐会更倾向于能让平台赚取佣金的商品吗?当用户给出模糊指令时,它会选择利润率更高的选项吗?

这种潜在的利益冲突,是所有「智能体」模式的核心困境。这个智能体,最终服务的到底是用户的利益,还是平台自身的利益?

历史告诉我们,当两者冲突时,平台总有办法让自己的利益获胜。

写在最后:通往 AGI 之路,由购物车铺就

回看 OpenAI 的旅程,不禁让人感慨。它从一个理想主义的非营利组织开始,怀揣着引领 AGI 安全发展的使命。

如今,它已经成为硅谷最炙手可热的商业巨头,其一举一动都牵动着整个科技行业的神经。

他们曾向我们许诺一个由超级智能驱动的未来,一个生产力极大解放、人类可以追求更高层次需求的奇点。Sam Altman 蹭在播客中畅想,AI 将在未来几十年帮助我们建造戴森球。然而,他们今天交付给我们的,是一个能帮你在聊天时更方便地从 Etsy 上买东西的功能。

这并不是说电商功能不好,或者 OpenAI 不该赚钱。商业化是任何技术走向成熟和普及的必经之路。

只是这种反差,这种从星辰大海到购物车按钮的急转直下,揭示了一个朴素而残酷的真理:任何宏大的技术叙事,最终都必须落地为具体的、能够产生现金流的商业模式。

通往 AGI 的道路,或许远比我们想象的要漫长和曲折,而且,它很可能是由无数个「添加到购物车」的按钮铺就的。

当 AI 变得越来越像一个精明的导购员,而不是一个无所不知的先知时,我们或许应该感到庆幸。

因为它提醒我们,无论技术如何发展,那些底层的商业逻辑和人性动机,从未改变。

我们创造了这些强大的「思维」,希望它们能解答宇宙的奥秘,而它们学会的第一个真正的商业技能,是帮我们花钱。

这或许不是我们想要的奇点,但它很可能是我们应得的那个。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ACP:智能体电商协议
  • 为什么是现在?为什么是电商?
  • 入口之战:互联网的下一片高地
  • 用户的信任与智能体的困境
  • 写在最后:通往 AGI 之路,由购物车铺就
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档