首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI推翻80年数学猜想,这意味着什么?

AI推翻80年数学猜想,这意味着什么?

作者头像
安徽开发者圈
修改2026-05-24 20:54:07
修改2026-05-24 20:54:07
1720
举报
文章被收录于专栏:安徽开发者圈安徽开发者圈

当AI不再只会做算术,而是开始做数学—一条横跨80年的逻辑链,被一段代码重新改写。

一道挂了80年的数学悬赏令

1946年,匈牙利裔数学天才保罗·埃尔德什(Paul Erdős)提出了一个关于几何最优构型的猜想。

简单来说,他认为在某种度量下,正方形网格结构就是最优解—没有比它更好的排列方式了。

这个问题看起来简单,但它横跨了几何学、组合数学和数论三大领域,80年来无人能给出严格证明,也无人能推翻。

直到这个星期。

OpenAI的推理模型,找到了反例

OpenAI宣布,其全新通用推理模型自主推导出了一个原创数学证明—不是复现已有答案,而是从零构建了一条完整的逻辑链,最终推翻了埃尔德什的猜想。

关键在于:这个模型并非为数学问题量身打造。它是一个通用推理系统,解决这道难题只是它能力的「副产品」。

近八十年来,数学家们始终认为最优解的形态大致趋近于正方形网格结构。如今我们的模型推翻了这一固有认知,发现了一类表现更为优异的全新构造体系。 —— OpenAI

更值得注意的是,这次OpenAI吸取了教训。七个月前,公司前副总裁曾声称GPT-5解开了10道埃尔德什难题,结果被扒出只是找到了文献中已有的解法,引来杨立昆、哈萨比斯等大佬嘲讽。

这一次,OpenAI附上了多位独立数学家的佐证,包括诺加·阿隆(Noga Alon)、梅兰妮·伍德(Melanie Wood),以及运营埃尔德什难题专题网站、此前直言OpenAI上次「严重失实」的托马斯·布鲁姆(Thomas Bloom)。

这意味着什么?远不止一道数学题

如果你觉得AI解了一道数学题跟你没什么关系,那可能低估了这件事的分量。

第一,推理能力的质变。 过去的AI擅长模式匹配—给你一堆数据,找规律。但真正的数学证明需要长链逻辑推理,每一步都必须严丝合缝,中间断一环就全盘崩溃。这次突破说明,AI已经能构建并维护超长推理链条。

第二,跨学科连接能力。 OpenAI强调,这个模型能以人类研究者未曾设想的方式,打通不同学科的知识关联。它在几何学中用到的推理路径,可能连数学家自己都没想过。

第三,对基础科学的连锁效应。 OpenAI明确指出,这一能力将对生物学、物理学、工程学、医学产生深远影响。数学是所有自然科学的基础语言——当AI开始用这种语言「独立思考」,下游学科的突破可能只是时间问题。

人工智能正助力我们全方位探索数百年来人类搭建起的数学知识殿堂,还有多少未曾发掘的精妙奥秘,正静待世人发现? —— 托马斯·布鲁姆(数学家)

但我们也该冷静一下

在欢呼之前,有几点值得注意:

🔴 通用的定义需要谨慎。 OpenAI说的是「通用推理模型」,但没有公布具体的技术细节和模型架构。在完整论文发表之前,学术界会保持审慎。

🔴 数学证明 ≠ 通用智能。 推翻一道几何猜想很了不起,但距离AGI(通用人工智能)还有很长的路。AI在开放性、创造性任务上的表现仍然有限。

🔴 黑箱问题依然存在。 我们看到的是结果(猜想被推翻了),但AI的推理过程是否可解释、可复现,这才是科学界最关心的问题。

写在最后

从2022年ChatGPT横空出世,到2026年AI推翻80年数学难题——四年时间,AI从一个「会聊天的工具」变成了一个「会思考的研究伙伴」。

下一个被AI改写的领域会是什么?物理学?生物学?还是经济学?

答案也许不需要等太久。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 安徽开发者圈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一道挂了80年的数学悬赏令
  • OpenAI的推理模型,找到了反例
  • 这意味着什么?远不止一道数学题
  • 但我们也该冷静一下
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档