AI开始帮人类做科研了，从效率工具到知识引擎

老周聊架构

发布于 2026-06-08 12:49:14

一个 AI 模型，预测了 2 亿个蛋白质的三维结构。

人类生物学家用了 50 年，通过实验方法解析了大约 19 万个蛋白质结构。AlphaFold 用了不到 2 年，直接把这个数字乘以了 1000 倍。

这不是"提效"，这是"改写游戏规则"。

如果说之前的 AI 是在帮人类"写代码"和"画图"，现在的 AI 开始帮人类做科研了。

本周，Google 发布了 Gemini for Science——把 Deep Think（深度思考）和 Deep Research（深度研究）能力整合进科研场景，并通过 Science Skills 连接了 Antigravity 等智能体平台，一口气打通了 30 多个主要生命科学数据库和工具。

与此同时，欧洲的 Mistral 悄悄收购了一批"物理 AI"人才——搞大语言模型的公司，开始招研究物理定律的人了。

当 AI 公司开始雇物理学家，你就知道这个行业要变天了。

今天拆开来看，AI for Science 到底走到了哪一步，Google 的科研 AI 架构是什么样的，以及——为什么这可能是 AI 最大的"隐藏主线"。

一、从"AI 助手"到"AI 科学家"

科研 AI 的三个阶段

AI 在科研领域的应用，经历了三个清晰的阶段：

阶段一：工具级（2015-2020）。 AI 作为科研的"计算工具"——跑个回归分析、做个图像分类、处理一下数据。本质上和 Excel 没有质的区别，只是更快、更准。

阶段二：发现级（2020-2025）。 AI 开始发现人类没发现的东西。AlphaFold 预测蛋白质结构、GNoME 发现 220 万种新材料、AlphaGeometry 解奥数题。AI 从"干活的工具"变成了"有洞察力的助手"。

阶段三：自主级（2025-）。 AI 开始独立设计和执行科研流程。提出假设 → 设计实验 → 分析数据 → 得出结论 → 提出新假设——整个循环由 AI 驱动，人类只需要审核和把关。

Gemini for Science 正处在从阶段二到阶段三的过渡期。 它不仅能帮你查文献、分析数据，还能主动设计研究路径。

为什么科研是 AI 的"终极战场"？

有人可能会问：AI 写代码、AI 画图已经很厉害了，为什么还要折腾科研？

因为科研是人类知识生产的源头。

AI 写代码 → 提升软件生产效率
AI 画图 → 提升内容生产效率
AI 做科研 → 提升知识生产效率

前两者是"做得更快"，后者是"知道得更多"。 做得更快有天花板，知道得更多没有上限。

新药研发周期从 10 年缩短到 2 年、新材料从发现到量产从 20 年缩短到 3 年、气候模型的精度提升 10 倍——这些变化的经济价值，远超"AI 帮你写了一封邮件"。

二、Gemini for Science：Google 的科研 AI 架构

三层架构

Google 的 Gemini for Science 不是一个单一的模型，而是一套三层架构：

第一层：Deep Think（深度思考引擎）。

这是 Gemini 的长链推理能力——面对复杂的科学问题，能进行多步推理、自我验证、反思纠错。

传统 LLM 的问题是"一本正经地胡说八道"。Deep Think 的改进是：在回答科学问题前，先在内部进行多轮推理链验证，如果发现逻辑矛盾就自动修正。

类比一下：普通 LLM 像一个反应很快但容易口误的学生，Deep Think 像一个先在草稿纸上演算三遍再回答的学生。

第二层：Deep Research（深度研究引擎）。

自动化的文献检索 + 综述生成。给它一个研究问题，它会：

检索相关论文（不只是关键词匹配，而是语义理解）
阅读并理解论文内容
交叉验证不同论文的观点
生成结构化的研究综述
指出现有研究的空白和矛盾

一个博士生写文献综述可能需要 2-3 个月。Deep Research 可以在 几分钟内生成初稿——当然，质量还需要人类审核，但大幅缩短了"从无到有"的时间。

第三层：Science Skills（科学技能平台）。

这是最关键的一层。Science Skills 通过 Antigravity 等智能体平台，把 Gemini 连接到了 30 多个主要生命科学数据库和工具：

数据库连接： UniProt（蛋白质）、PDB（蛋白质结构）、ChEMBL（化合物活性）、ClinicalTrials.gov（临床试验）等
工具调用： 分子对接模拟、基因组分析、蛋白质折叠预测、化学反应预测等
工作流编排： 把多个工具串成自动化的科研流程

这相当于给 AI 科学家配了一个"满编实验室"。 以前 AI 只能读论文和想点子，现在它可以直接调用实验工具来验证假设。

一个具体例子：AI 驱动的药物发现

假设你想找到一种能抑制某个癌症靶点的新化合物：

传统流程（2-3 年）：

文献调研，了解靶点结构（3 个月）
从化合物库中筛选候选分子（6 个月）
分子对接模拟，预测结合能力（3 个月）
合成候选化合物并做体外实验（6 个月）
优化先导化合物（6 个月）

Gemini for Science 流程（2-3 个月）：

Deep Research 自动检索靶点相关论文，生成综述（1 天）
Science Skills 调用 PDB 获取靶点 3D 结构（几秒）
Science Skills 调用 ChEMBL 筛选已知活性化合物（几分钟）
Deep Think 分析构效关系，设计新化合物骨架（几小时）
Science Skills 调用分子对接工具预测结合能力（几小时）
输出排名靠前的候选分子，供实验室验证（1 天）

从"年"到"月"的跨越。 当然，湿实验（真实的化学合成和生物测试）仍然需要时间，AI 目前替代不了。但"从靶点到候选分子"这个纯计算环节，被压缩了 10 倍以上。

三、Mistral 收购"物理 AI"人才：欧洲的科学野心

为什么 Mistral 要招物理学家？

Mistral 是欧洲最强的 AI 公司，以高效的开源模型著称。它最近收购了一批研究物理 AI（Physics AI） 的人才。

物理 AI 是什么？简单说：让 AI 理解并遵守物理定律。

现有的 AI 模型（包括 GPT-4、Gemini）在处理物理问题时有一个根本性的缺陷：它们是从文本和数据中学习的，而不是从物理定律中学习的。

这意味着：模型可能"知道"牛顿第二定律 F=ma，但它不是从物理第一性原理推导出来的——它只是在训练数据中"见过"这个公式。

知道公式和理解公式，是两回事。

物理 AI 的目标是把物理定律内嵌到模型架构中。比如：

守恒律约束： 模型的输出必须满足能量守恒、动量守恒
对称性约束： 物理系统的对称性（平移对称、旋转对称）被编码到模型结构中
微分方程求解： 模型直接学习偏微分方程的解空间，而不是拟合数据点

科学 AI 的竞争格局

Mistral 的这步棋，揭示了科学 AI 领域正在形成的竞争格局：

玩家	策略	优势领域
Google DeepMind	全栈自研（AlphaFold + Gemini）	生命科学、材料科学
Google Gemini	平台化（Science Skills 连接生态）	科研工作流、数据库整合
Mistral	收购物理 AI 人才	物理模拟、工程仿真
Meta FAIR	开源科学模型（ESM）	蛋白质语言模型
Microsoft Research	Azure 科研云 + 合作高校	气候模型、分子动力学