谷歌深夜炸场：通用 AI 科学家 AlphaEvolve 破解数学难题，优化 TPU 设计，帮助 Gemini 训练！

不二小段

发布于 2026-04-09 15:02:33

1270

谷歌 DeepMind 深夜甩出重磅研究——一个名为 AlphaEvolve 的通用 AI 智能体横空出世。简单来说，这是个「算法进化大师」，能设计和优化超复杂的算法，不仅在数学和计算领域大显身手，甚至已经开始赋能谷歌自家的数据中心、芯片设计乃至 Gemini 大模型的训练！

德国马克斯·普朗克研究所的 Mario Krenn 直呼「太惊艳了」，认为 AlphaEvolve 是「首个基于通用大语言模型实现新发现的成功案例」。DeepMind 科学主管 Pushmeet Kohli 也表示，AlphaEvolve 已经产生了「实质性影响」。

那么，这个 AlphaEvolve 到底有多牛？它又是怎么工作的呢？且听我们细细道来。

AlphaEvolve：当 LLM 的创造力遇上进化算法

我们知道，大语言模型（LLM）在文本总结、代码生成、创意发散等方面已经展现了惊人的通用性。而 AlphaEvolve 则将 LLM 的这些能力提升到了一个新高度，专门攻克数学和现代计算领域那些基础且高度复杂的难题。

AlphaEvolve 的核心机制，是将谷歌 Gemini 模型的强大创造力与自动化评估器相结合，并通过一个进化框架不断筛选和改进最有潜力的解决方案。

具体来说，它的工作流程是这样的（见下图）：

1. 人类定义「目标」 (What)：用户首先设定评估标准，提供一个初始的解决方案（哪怕很简单），以及可选的背景知识。
2. AlphaEvolve 探索「如何实现」 (How)：
- 提示采样器 (Prompt sampler)：从程序数据库中选取以往的程序，构建包含丰富上下文（如过去的试验和想法）的提示。
- LLM 集群 (LLMs ensemble)：AlphaEvolve 巧妙地结合了 Gemini 家族的多个模型。速度快、效率高的 Gemini Flash 负责「广撒网」，探索各种可能的想法；而能力更强的 Gemini Pro 则负责「深挖井」，提供富有洞察力的建议。它们根据提示生成新的程序或对现有程序的修改建议（以 diff 形式）。
- 评估器 (Evaluators pool)：自动化的评估器会运行这些新生成的程序，并根据预设的指标（比如算法效率、资源消耗等）打分。这个过程是客观且可量化的，确保了反馈的准确性。
- 程序数据库 (Program database)：表现优异的程序会被存入数据库，成为下一轮进化的「种子选手」或「灵感来源」。通过一代又一代的迭代优化，算法不断进化，越来越强。

值得一提的是，AlphaEvolve 不仅仅是像它前辈 FunSearch 那样只能进化单个函数（最多几十行代码），而是能够进化整个代码库（可达数百行代码），处理更为复杂的算法，并且支持多种编程语言。它还能同时优化多个评估指标，这对于很多复杂问题来说至关重要。

N 大应用场景曝光：从数学突破到谷歌基建优化

AlphaEvolve 的强大之处不仅在于理论创新，更在于实实在在的应用成果。

1. 攻克56年数学难题，刷新矩阵乘法纪录！

矩阵乘法是计算机科学中的基石运算，几十年来无数科学家致力于寻找更快的算法。早在1969年，Strassen 就提出了一个经典算法。而 AlphaEvolve，这个通用型 AI 智能体，竟然在这方面取得了惊人突破！

4x4 复数矩阵乘法新纪录：AlphaEvolve 发现了一种新的算法，仅需 48 次标量乘法 就能完成 4x4 复数矩阵的相乘，成功改进了 Strassen 保持了 56 年的算法（之前需要 49 次）。要知道，DeepMind 之前专门为矩阵乘法设计的 AlphaTensor，在 4x4 矩阵上也只在二元运算中找到了改进。这次 AlphaEvolve 的通用能力战胜了专用工具，令人印象深刻！
广泛刷新纪录：在研究人员测试的多个矩阵乘法尺寸中，AlphaEvolve 在 14 个不同目标上改进了当前最优算法。

AlphaEvolve 是通过进化一个基于梯度的优化程序来实现这一点的，它对优化器、权重初始化、损失函数、超参数扫描等多个组件都进行了非同小可的修改，整个进化过程包含了多达 15 次「变异」。

2. 破解数学开放问题，「刷榜」超50项！

除了矩阵乘法，AlphaEvolve 还在更广泛的数学领域展现了其「科研助理」的潜力。研究人员将其应用于数学分析、几何、组合数学和数论等领域的超过 50 个开放性问题。

结果如何？

在约 75% 的案例中，AlphaEvolve 重新发现了已知的最优解。
在约 20% 的案例中，AlphaEvolve改进了先前已知的最佳解决方案，推动了相应开放问题的进展！
- 亲吻数问题 (Kissing Number Problem)：这个困扰数学家 300 多年的几何难题，旨在确定一个中心单位球最多能同时接触多少个互不重叠的单位球。AlphaEvolve 在 11 维空间中发现了一个包含 593 个外层球体的构型，刷新了该维度下的下界纪录（此前为 592）。
- 还包括 Erdős 提出的最小重叠问题等。

研究人员指出，AlphaEvolve 能够进化启发式搜索算法，而不是直接进化构造本身，这使得它能够快速应用于各种数学问题，并自主发现有效的搜索模式和攻击策略。

3. 深入谷歌「心脏」，优化基础设施

AlphaEvolve 不仅在学术界发光发热，更在谷歌内部的计算生态系统中大展拳脚，带来了实实在在的效益。

改进数据中心调度：谷歌庞大的数据中心由 Borg 系统负责调度。AlphaEvolve 发现了一个简洁高效的启发式算法，帮助 Borg 更有效地编排任务。该方案已在生产环境中运行一年多，平均为谷歌全球计算资源回收了 0.7%！这意味着在相同的计算足迹下可以完成更多任务。而且，AlphaEvolve 生成的代码具有良好的可解释性、可调试性和可预测性，便于部署。
助力 TPU 硬件设计：TPU 是谷歌自研的 AI 加速器。AlphaEvolve 提出了一个 Verilog 代码重写方案，移除了一个高度优化的矩阵乘法算术电路中的冗余比特。这一改进将被集成到下一代 TPU 中。通过使用芯片设计师的「标准语言」，AlphaEvolve 促进了 AI 与硬件工程师的协作。
提升 Gemini 训练与推理效率：
- 通过找到更智能的方法来分解大型矩阵乘法运算，AlphaEvolve 将 Gemini 架构中一个关键核心计算（kernel）的速度提升了 23%，从而使 Gemini 的训练时间减少了 1%。要知道，训练大模型耗费巨大算力，每一点效率提升都意味着可观的成本节约。同时，这也将原本需要数周专家努力的内核优化时间缩短到了几天的自动化实验。
- AlphaEvolve 还能优化底层的 GPU 指令。对于 Transformer 模型中常用的 FlashAttention 内核，AlphaEvolve 实现了高达 32.5% 的加速。这有助于专家定位性能瓶颈，提升生产力。

更神奇的是，这意味着Gemini 通过 AlphaEvolve 的能力，优化了其自身的训练过程！

未来展望与挑战

AlphaEvolve 的出现，标志着从针对特定领域发现算法，到为广泛的现实世界挑战开发更复杂算法的进步。随着大语言模型能力的不断增强（尤其是在编码方面），AlphaEvolve 的潜力无疑将持续提升。

DeepMind 团队已经为 AlphaEvolve 构建了友好的用户界面，并计划推出面向学术用户的早期访问计划 (Early Access Program)，同时也在探索更广泛的开放可能性。

当然，AlphaEvolve 并非万能。牛津大学的数学家 Simon Frieder 认为，它可能主要适用于那些能通过代码解决的「狭窄领域」问题。俄亥俄州立大学的 AI 研究员 Huan Sun 则表示，在更广泛的社区测试之前，对结果持谨慎态度。

目前，AlphaEvolve 的一个主要限制是，它需要问题能够被清晰地定义并拥有自动化的评估指标。此外，运行 AlphaEvolve（尽管比 AlphaTensor 消耗资源少）对于免费开放来说仍然过于昂贵。

尽管如此，AlphaEvolve 的通用性使其有望在材料科学、药物发现、可持续发展以及更广泛的技术和商业应用中发挥变革性作用。正如 DeepMind 所期望的那样，AlphaEvolve 的发布将鼓励研究人员提出更多可以应用该系统的科学领域。

我们有理由相信，像 AlphaEvolve 这样的 AI 编码智能体，将成为未来科学发现和算法创新的强大引擎。让我们拭目以待，看它如何在更多领域掀起「进化」风暴！

参考链接： [1] https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/ [2] https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf [3] https://www.nature.com/articles/d41586-025-01523-z

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2025-05-15，如有侵权请联系 cloudcommunity@tencent.com 删除

模型