2025年AI研究突破：推理、代理与科学进展

原创

用户11764306

发布于 2026-05-10 22:31:26

6010

2025年回顾：八大研究突破领域

2025年是研究取得非凡进展的一年。人工智能正从工具转变为实用技术。如果说2024年是奠定多模态基础的一年，那么2025年就是AI开始真正思考、行动并与我们一同探索世界的一年。在量子计算方面，我们向着实际应用迈进了。总体而言，我们帮助将研究转化为现实，用更强大、更有用的产品和工具对当今人们的生活产生积极影响。以下是回顾某机构、某机构DeepMind和某机构研究在持续进步的一年中所定义的工作——那些突破、产品和科学里程碑。

在世界级模型上实现突破

今年，我们通过推理、多模态理解、模型效率和生成能力方面的突破，显著提升了模型能力。从3月发布Gemini 2.5开始，到11月推出Gemini 3和12月推出Gemini 3 Flash达到高潮。

Gemini 3 Pro构建于最先进的推理基础之上，是我们迄今为止最强大的模型，旨在帮助将任何想法变为现实。它在LMArena排行榜上位居榜首，并在“人类最后一考”和GPQA Diamond等基准测试中凭借突破性分数重新定义了多模态推理。它还在数学领域为前沿模型设立了新标准，在MathArena Apex上达到23.4%的最新水平。随后推出的Gemini 3 Flash，将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合，成为同尺寸下性能最强的模型。

致力于让有用的AI技术易于获取，开放模型Gemma系列轻量级且公开可用；今年实现了多模态能力、大幅增加上下文窗口、扩展多语言能力并提升效率与性能。

用AI创新和改造产品

2025年，继续推进AI从工具到实用技术的演进，用新的、强大的代理能力改造产品组合。通过超越辅助编码的工具，引入与开发者协作的强大代理系统，重新构想软件开发。

这一演进在核心产品中也很明显，从Pixel 10的AI功能、搜索中AI模式的更新（如生成式UI），到Gemini应用和NotebookLM等AI优先的创新。

赋能创意，与AI共创

2025年是生成式媒体的变革之年，为人们实现创意抱负提供了前所未有的能力。视频、图像、音频和世界生成的模型与工具变得更加有效并被广泛使用。与创意行业人士合作开发Flow和Music AI Sandbox等工具，使其更有助于创意工作流，并通过Gemini应用中的图像编辑重大升级以及Veo 3.1、Imagen 4和Flow等强大新模型的引入，扩展了人们的创意可能性。

某机构实验室是该机构在开发过程中分享AI实验的地方，通过用户反馈不断演进。今年一些最具吸引力的实验包括：Pomelli（品牌营销内容生成）、Stitch（将提示和图像输入在几分钟内转化为复杂UI设计和前端代码）、Jules（异步编码代理，作为开发人员的协作者）以及Google Beam（一个3D视频通信平台，利用AI提升远程临场感）。

推进科学与数学

2025年也是AI推动科学进步的标志性一年，在生命科学、健康、自然科学和数学领域取得突破。一年间，在构建赋能研究人员的AI资源和工具方面取得进展，帮助他们理解、识别和开发医疗保健领域的治疗方法。在基因组学领域（已应用先进技术研究十年），超越了测序阶段，利用AI解读最复杂的数据。同时，迎来了AlphaFold（解决50年历史的蛋白质折叠问题并获得诺贝尔奖的AI系统）五周年纪念。

Gemini的先进思维能力，包括Deep Think，也促成了数学和编码领域的历史性进展。Deep Think能够解决需要深度抽象推理的问题，在两个国际竞赛中达到金牌水准。

塑造计算与物理世界的创新

在量子计算、能源和登月计划等领域引领重大发现并塑造科学未来。量子计算实际应用取得进展，例如通过Quantum Echoes算法，以及某机构研究员Michel Devoret因1980年代的基础量子研究获得诺贝尔物理学奖。

2025年，继续推进驱动AI的核心基础设施，专注于硬件设计突破和提高能效。推出了Ironwood——专为推理时代构建的新一代TPU，其设计采用了AlphaChip方法。

在机器人和视觉理解方面的工作将AI代理带入物理和虚拟世界，取得了像Gemini Robotics基础模型、更复杂的Gemini Robotics 1.5以及Genie 3（通用世界模型的新前沿）等进展。

大规模应对全球挑战与机遇

2025年的工作展示了AI驱动的科学进步如何直接应用于解决世界上最关键和最普遍的挑战。通过利用最先进的基础模型和代理推理，显著提升了对地球及其系统的理解，同时在气候适应、公共健康和教育等对人类福祉至关重要的领域提供了有影响力的解决方案。

例如，利用最先进的基础模型和代理推理来帮助提高对地球的理解，从而在天气预测、城市规划到公共健康等方面为人们的生活带来改变。洪水预测信息现已覆盖150个国家的超过20亿人口，针对严重的河流洪水。最先进、最高效的预测模型WeatherNext 2生成预测的速度快8倍，分辨率可达1小时。

与合作伙伴一起，将AI驱动的科学进步更贴近患者，为疾病管理和治疗发现开辟新途径。AI在教育领域也被证明是强大的工具，通过LearnLM和Gemini中的引导式学习等倡议，实现新形式的理解和扩展好奇心。将Gemini最强大的翻译能力带到某机构翻译中，实现更智能、更自然、更准确的翻译，并试点新的语音到语音翻译能力。

优先考虑责任与安全

将研究突破与严格的前瞻性责任与安全工作相结合。随着模型能力增强，持续改进和演进工具、资源和安全框架，以预测和缓解风险。Gemini 3展示了这一实践：它是最安全的模型，经历了某机构所有AI模型中最全面的安全评估。并且正在进一步展望未来，探索通往AGI（通用人工智能）的负责任路径，优先考虑准备、主动风险评估以及与更广泛AI社区的合作。

引领与产业界、学术界和公民社会的前沿合作

负责任地推进AI前沿需要社会各界的合作。2025年，与领先的AI实验室合作，帮助成立了Agentic AI Foundation，并支持开放标准，以确保代理AI的负责任和可互操作的未来。在教育领域，与Miami Dade County等学区和Raspberry Pi等教育团体合作，为学生和教育工作者提供AI技能。与加州大学伯克利分校、耶鲁大学、芝加哥大学等大学的研究合作伙伴关系对今年一些最激动人心的前沿研究起到了重要作用。正与美国能源部17个国家实验室合作，改变科学研究的方式。同时，与电影制作人和其他创意愿景者合作，将最好的AI工具交到他们手中，探索AI时代的故事讲述。