AI与Web历史对比中的技术演进启示

原创

用户11764306

发布于 2026-05-19 12:16:49

1380

不要混淆“提升下限”与“拔高上限”

技术提升下限意味着降低准入门槛，让本地商店无需网页开发者即可搭建网站或网店，也让待办事项应用通过API增加AI翻译功能。提升下限是让默认基础对所有人变得更好，从而降低进入壁垒。

而拔高上限则是改进最佳版本，使其比以往更高。例如流媒体服务精心优化网页媒体播放器，哪怕只快一毫秒，也能增加用户在应用内的停留时间；酒店预订平台投入大量资源改进推荐算法，因为邮件点击率微增就能显著提高收入。

在AI领域，大量工作发生在上限层面：包括新模型与新技术学术研究、增强开发环境与基础组件，甚至IDE和Python语言本身的改进。浏览器和Web标准不断突破网页可能性边界，AI研究也在持续解锁新能力。这些成果向下沉淀到React、PyTorch、spaCy等框架，最终落地为网站构建器或AI API等产品。在下限层面我们看到高采用率，而拔高上限的用例则具有特别高的价值。

高价值用例永远值得专门的开发投入。这类场景中“更好即更好”。人们搭建网站更容易，不代表公司停止投资Web开发——恰恰相反。同样，LLM和API让任何人都能轻松使用强大AI功能并将其集成到应用中，但这并不意味着对从事高价值用例的AI开发者没有需求——这类需求从未短缺。技术让开发者能做新事，也让他们能做更多同样的事。

只要存在军备竞赛或竞争，“更好即更好”的局面就会出现。数字营销或注意力经济遵循这一规律。如果比竞争对手稍微好一点就能带来优势，那么每个人都必须持续投资，永远不会出现“足够好就行”的情况。事实上，当年公司对改进的渴望如此强烈，以至于大力投资Flash，尽管效果普遍糟糕——被甩在后面似乎比加大投资换取更差结果更可怕，希望这是通往更好未来的投资。生成式AI当前正上演同样剧情，随处可见的“给产品加个聊天机器人”趋势及由此导致的消费端产品“Clippy化”就是明证。

LLM让定制化解决方案更易获得

讨论下限提升者与上限拔高者时还有另一个动态：下限提升者通常相互竞争，而上限拔高者相互补充。提供简单、足够好的解决方案有很多不同方式，通常无法通过组合这些方式得到更易用且同样好、或同样易用且更好的方案——一旦组合，就会增加复杂性，削弱易用性。相反，若追求最佳结果，往往可以组合使用多种技术。

不是将LLM作为系统本身，而是用LLM来构建系统。

LLM本身提供了另一种“提升下限”的方式：开发支持。它们提供越来越好的交互式编程辅助，非常擅长引导开发者进入机器学习等新领域。将LLM用作通用分类器的论点是其准入门槛比设计、训练和评估定制化监督式ML解决方案低得多。但有了LLM的建议和编码支持，这一论点应该被重新评估。

开发流程让你重获控制权

互联网早期，网站大多是静态的。但我们需要更多灵活性，因此Web 2.0转向动态交互特性：用PHP在服务端渲染，或用JavaScript在浏览器中增强。同时博客和CMS平台（如某机构的WordPress）兴起，它们处理后端复杂性和托管，但这可能使网站变慢、难维护，或意味着放弃控制权和完全定制化体验的能力。

如今这一切依然相关。但如果你最近构建过现代网站或博客，很可能使用了静态站点生成器（如Hugo）或框架（如Next.js），后者将操作复杂性转移到构建过程而非运行时。站点提前编译而非在服务端编译，并通过摇树优化等技术优化性能。使用TypeScript，我们从一个动态语言的权衡切换到编译型语言的权衡。这常是人们抱怨当今Web开发变得复杂的原因。但总体而言，它让Web变得更好、更易用，并赋予我们更多控制权。

随时间演进的开发工作流与技术

这实际上与AI领域的很多发展相呼应。当机器学习和深度学习首次被广泛采用时，通常用scikit-learn、PyTorch或TensorFlow等库训练自己的模型，或使用spaCy等框架提供的现有实现——这通常需要大量工作和投入。但随着更大语言模型和更好泛化能力，依赖预训练模型成为可能，无需或仅需极少量微调。这催生了某机构OpenAI或某机构Cohere等API平台的兴起，为大型模型提供便捷访问，简化了原本复杂的MLOps托管，以控制权和隐私换取便利。

缓解这些缺点的下一步是回归定制化模型，但使用更好、更强大的工具。在这里，我们也正在将操作复杂性从运行时转移到开发过程，并利用迁移学习等技术。人机协同蒸馏就是一个例子：使用大型生成模型创建数据，用于训练更精确、更小、更快、可内部部署的私有模型。这种使用模式为高价值用例提供了所需灵活性，使得内部开发AI特性再次可行——正如现代JavaScript工具链为完全定制化的网站和Web应用自动化构建过程。

高价值用例值得开发投入

某机构S&P Global的项目就是高价值用例的例子。为使市场更透明并为客户提供结构化数据馈送，该团队开发了一个新系统，实时提取商品交易洞察作为结构化属性。由于这些信息可能显著影响市场和冲击经济，确保其保持在内部并在高安全环境中运行至关重要。

通过使用Prodigy在标注过程中引入LLM，该团队实现了10倍的数据开发加速，人和模型协同工作，每个模型仅需15人时即可创建专门的训练和评估数据。6MB的spaCy流水线以约16k词/秒的速度运行，准确率高达99%。

人机协同蒸馏工作流：使用迁移学习和LLM进行半自动标注来创建定制化模型。

该项目是新技术和新工具如何让公司重获模型控制权的绝佳例证，将对操作复杂且昂贵资源的依赖转移到开发和构建过程。

重新发明轮子与道路

在争夺市场主导地位的过程中，大型科技公司不仅试图重新发明轮子，还试图重新发明道路，以塑造我们使用和部署技术的方式。重新发明轮子未必是坏事，问题在于产品和公司同时试图重新发明道路，并将你锁定在他们的做事方式中。

某机构Google不仅是使用最多的搜索引擎，还开发了最流行的浏览器Chrome及其内核Chromium（驱动Edge、Opera、Arc等），以及集成到搜索和其他应用中的Gemini模型和聊天机器人。AMP（加速移动页面）是另一个这样的产品——一个用于更快移动性能的开源框架。某机构Google会惩罚慢速网页以提供更用户友好的结果，并鼓励网站采用现代技术和Web标准，这已不是秘密。但批评者指出，通过本质上强迫Web采用AMP，该机构正在施加不当控制，进一步将发布者锁定在其生态系统中。广告正是这一切汇聚之处，为该机构带来每年超过2000亿美元的巨额收入。

这种“同时重新发明轮子和道路”的经久考验策略已在AI领域全面展开，正如某机构Microsoft的“拥抱、扩展、消灭”策略：拥抱共同标准，实现自己的扩展，将用户锁定到自己的生态系统，最终彻底瓦解共同标准。

AI产品不仅仅是模型

关于生成式AI的危险及政府监管必要性已有大量讨论。但话语中常缺失的一个重要区分是：面向人类的系统与面向机器的模型。“AI”通常既指代ChatGPT这样的产品，也指底层的GPT-4和Gemini等模型。这有意无意地混淆了水，可能对法规如何处理模型工件和开源软件产生持久影响。

对于面向人类的系统，最重要的区分是产品而不仅仅是技术。这包括用户界面和用户体验、产品营销方式以及围绕支撑技术实现的定制化。我们不完全知道ChatGPT内部如何工作，但它很可能在模型周围实现了广泛的护栏和自定义逻辑，以提供最佳用户体验。

另一方面，面向机器的模型是基于公开学术研究的可替换组件。它们的影响是可量化的：速度、准确性、延迟和成本。LLM可以是产品或流程的一部分，甚至可以替换为完全不同的方法，而不真正改变产品本身的体验。

对这种AI观常见的反驳是：数据呢？某机构OpenAI和某机构Google难道没有海量用户数据让他们构建更好的技术吗？需要再次区分产品和模型。用户数据对产品是大优势，但不一定是对机器任务的基础。如果我们从生成式AI的最新进展中学到什么，那就是你不需要特定数据来获得通用知识——这正是大型语言模型的核心所在。某机构OpenAI很可能主导AI聊天助手市场，但这并不意味着他们会垄断底层的、可替换的模型和软件组件。由开放研究和开源软件在很大程度上实现的这种互操作性，恰恰是垄断的反面。

借助新的开发者工具和在开发时编译更小、私有模型的能力，公司现在不再局限于利用规模经济的第三方API提供商。如果你试图构建一个做特定事情的系统，你不需要将请求转换为任意形式的语言，然后调用最能理解任意语言的大型模型。开发那些模型的人在讲述这样的故事，但我们其他人没有义务相信他们。FINISHED

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

AI 互动体验展