首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI与Web历史对比中的技术演进启示

AI与Web历史对比中的技术演进启示

原创
作者头像
用户11764306
发布2026-05-19 12:16:49
发布2026-05-19 12:16:49
840
举报

不要混淆“提升下限”与“拔高上限”

技术提升下限意味着降低准入门槛,让本地商店无需网页开发者即可搭建网站或网店,也让待办事项应用通过API增加AI翻译功能。提升下限是让默认基础对所有人变得更好,从而降低进入壁垒。

而拔高上限则是改进最佳版本,使其比以往更高。例如流媒体服务精心优化网页媒体播放器,哪怕只快一毫秒,也能增加用户在应用内的停留时间;酒店预订平台投入大量资源改进推荐算法,因为邮件点击率微增就能显著提高收入。

在AI领域,大量工作发生在上限层面:包括新模型与新技术学术研究、增强开发环境与基础组件,甚至IDE和Python语言本身的改进。浏览器和Web标准不断突破网页可能性边界,AI研究也在持续解锁新能力。这些成果向下沉淀到React、PyTorch、spaCy等框架,最终落地为网站构建器或AI API等产品。在下限层面我们看到高采用率,而拔高上限的用例则具有特别高的价值。

高价值用例永远值得专门的开发投入。这类场景中“更好即更好”。人们搭建网站更容易,不代表公司停止投资Web开发——恰恰相反。同样,LLM和API让任何人都能轻松使用强大AI功能并将其集成到应用中,但这并不意味着对从事高价值用例的AI开发者没有需求——这类需求从未短缺。技术让开发者能做新事,也让他们能做更多同样的事。

只要存在军备竞赛或竞争,“更好即更好”的局面就会出现。数字营销或注意力经济遵循这一规律。如果比竞争对手稍微好一点就能带来优势,那么每个人都必须持续投资,永远不会出现“足够好就行”的情况。事实上,当年公司对改进的渴望如此强烈,以至于大力投资Flash,尽管效果普遍糟糕——被甩在后面似乎比加大投资换取更差结果更可怕,希望这是通往更好未来的投资。生成式AI当前正上演同样剧情,随处可见的“给产品加个聊天机器人”趋势及由此导致的消费端产品“Clippy化”就是明证。

LLM让定制化解决方案更易获得

讨论下限提升者与上限拔高者时还有另一个动态:下限提升者通常相互竞争,而上限拔高者相互补充。提供简单、足够好的解决方案有很多不同方式,通常无法通过组合这些方式得到更易用且同样好、或同样易用且更好的方案——一旦组合,就会增加复杂性,削弱易用性。相反,若追求最佳结果,往往可以组合使用多种技术。

不是将LLM作为系统本身,而是用LLM来构建系统。

LLM本身提供了另一种“提升下限”的方式:开发支持。它们提供越来越好的交互式编程辅助,非常擅长引导开发者进入机器学习等新领域。将LLM用作通用分类器的论点是其准入门槛比设计、训练和评估定制化监督式ML解决方案低得多。但有了LLM的建议和编码支持,这一论点应该被重新评估。

开发流程让你重获控制权

互联网早期,网站大多是静态的。但我们需要更多灵活性,因此Web 2.0转向动态交互特性:用PHP在服务端渲染,或用JavaScript在浏览器中增强。同时博客和CMS平台(如某机构的WordPress)兴起,它们处理后端复杂性和托管,但这可能使网站变慢、难维护,或意味着放弃控制权和完全定制化体验的能力。

如今这一切依然相关。但如果你最近构建过现代网站或博客,很可能使用了静态站点生成器(如Hugo)或框架(如Next.js),后者将操作复杂性转移到构建过程而非运行时。站点提前编译而非在服务端编译,并通过摇树优化等技术优化性能。使用TypeScript,我们从一个动态语言的权衡切换到编译型语言的权衡。这常是人们抱怨当今Web开发变得复杂的原因。但总体而言,它让Web变得更好、更易用,并赋予我们更多控制权。

随时间演进的开发工作流与技术

这实际上与AI领域的很多发展相呼应。当机器学习和深度学习首次被广泛采用时,通常用scikit-learn、PyTorch或TensorFlow等库训练自己的模型,或使用spaCy等框架提供的现有实现——这通常需要大量工作和投入。但随着更大语言模型和更好泛化能力,依赖预训练模型成为可能,无需或仅需极少量微调。这催生了某机构OpenAI或某机构Cohere等API平台的兴起,为大型模型提供便捷访问,简化了原本复杂的MLOps托管,以控制权和隐私换取便利。

缓解这些缺点的下一步是回归定制化模型,但使用更好、更强大的工具。在这里,我们也正在将操作复杂性从运行时转移到开发过程,并利用迁移学习等技术。人机协同蒸馏就是一个例子:使用大型生成模型创建数据,用于训练更精确、更小、更快、可内部部署的私有模型。这种使用模式为高价值用例提供了所需灵活性,使得内部开发AI特性再次可行——正如现代JavaScript工具链为完全定制化的网站和Web应用自动化构建过程。

高价值用例值得开发投入

某机构S&P Global的项目就是高价值用例的例子。为使市场更透明并为客户提供结构化数据馈送,该团队开发了一个新系统,实时提取商品交易洞察作为结构化属性。由于这些信息可能显著影响市场和冲击经济,确保其保持在内部并在高安全环境中运行至关重要。

通过使用Prodigy在标注过程中引入LLM,该团队实现了10倍的数据开发加速,人和模型协同工作,每个模型仅需15人时即可创建专门的训练和评估数据。6MB的spaCy流水线以约16k词/秒的速度运行,准确率高达99%。

人机协同蒸馏工作流:使用迁移学习和LLM进行半自动标注来创建定制化模型。

该项目是新技术和新工具如何让公司重获模型控制权的绝佳例证,将对操作复杂且昂贵资源的依赖转移到开发和构建过程。

重新发明轮子与道路

在争夺市场主导地位的过程中,大型科技公司不仅试图重新发明轮子,还试图重新发明道路,以塑造我们使用和部署技术的方式。重新发明轮子未必是坏事,问题在于产品和公司同时试图重新发明道路,并将你锁定在他们的做事方式中。

某机构Google不仅是使用最多的搜索引擎,还开发了最流行的浏览器Chrome及其内核Chromium(驱动Edge、Opera、Arc等),以及集成到搜索和其他应用中的Gemini模型和聊天机器人。AMP(加速移动页面)是另一个这样的产品——一个用于更快移动性能的开源框架。某机构Google会惩罚慢速网页以提供更用户友好的结果,并鼓励网站采用现代技术和Web标准,这已不是秘密。但批评者指出,通过本质上强迫Web采用AMP,该机构正在施加不当控制,进一步将发布者锁定在其生态系统中。广告正是这一切汇聚之处,为该机构带来每年超过2000亿美元的巨额收入。

这种“同时重新发明轮子和道路”的经久考验策略已在AI领域全面展开,正如某机构Microsoft的“拥抱、扩展、消灭”策略:拥抱共同标准,实现自己的扩展,将用户锁定到自己的生态系统,最终彻底瓦解共同标准。

AI产品不仅仅是模型

关于生成式AI的危险及政府监管必要性已有大量讨论。但话语中常缺失的一个重要区分是:面向人类的系统与面向机器的模型。“AI”通常既指代ChatGPT这样的产品,也指底层的GPT-4和Gemini等模型。这有意无意地混淆了水,可能对法规如何处理模型工件和开源软件产生持久影响。

对于面向人类的系统,最重要的区分是产品而不仅仅是技术。这包括用户界面和用户体验、产品营销方式以及围绕支撑技术实现的定制化。我们不完全知道ChatGPT内部如何工作,但它很可能在模型周围实现了广泛的护栏和自定义逻辑,以提供最佳用户体验。

另一方面,面向机器的模型是基于公开学术研究的可替换组件。它们的影响是可量化的:速度、准确性、延迟和成本。LLM可以是产品或流程的一部分,甚至可以替换为完全不同的方法,而不真正改变产品本身的体验。

对这种AI观常见的反驳是:数据呢?某机构OpenAI和某机构Google难道没有海量用户数据让他们构建更好的技术吗?需要再次区分产品和模型。用户数据对产品是大优势,但不一定是对机器任务的基础。如果我们从生成式AI的最新进展中学到什么,那就是你不需要特定数据来获得通用知识——这正是大型语言模型的核心所在。某机构OpenAI很可能主导AI聊天助手市场,但这并不意味着他们会垄断底层的、可替换的模型和软件组件。由开放研究和开源软件在很大程度上实现的这种互操作性,恰恰是垄断的反面。

借助新的开发者工具和在开发时编译更小、私有模型的能力,公司现在不再局限于利用规模经济的第三方API提供商。如果你试图构建一个做特定事情的系统,你不需要将请求转换为任意形式的语言,然后调用最能理解任意语言的大型模型。开发那些模型的人在讲述这样的故事,但我们其他人没有义务相信他们。FINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 不要混淆“提升下限”与“拔高上限”
  • LLM让定制化解决方案更易获得
  • 开发流程让你重获控制权
  • 随时间演进的开发工作流与技术
  • 高价值用例值得开发投入
  • 重新发明轮子与道路
  • AI产品不仅仅是模型
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档