新闻资讯-歌剧话剧

谷歌的AlphaEvolve刚刚破解了困扰数学家数十年的拉姆齐数难题

发布时间:2026-03-12 17:18:52  浏览量:2

有一类数学问题,伟大的匈牙利数学家保罗·埃尔德什曾留下一句广为流传的评语:如果外星人威胁要毁灭人类,除非我们算出R(5,5),我们最好把所有人类智慧都押进去。而如果他们要的是R(6,6),那就别算了,先想办法消灭外星人吧。

这就是拉姆齐数。它们不只是数学家圈子里的玩具,而是已知最难计算的组合数学对象之一,关系着秩序与混沌的底层逻辑。几十年来,每一个拉姆齐数下界的微小改进都需要专家们专门设计算法、花费大量时间才能换来。而谷歌DeepMind的AlphaEvolve在近日发布的一篇论文中,一次性改进了五个经典拉姆齐数的下界,其中部分纪录已经保持了逾十年未被触动。

直观地说,拉姆齐数回答的是一个看似简单的问题:一个结构需要多大,才能保证某种秩序必然出现?聚会场景是最常用的比喻:一个房间里至少要有多少人,才能确保其中要么有r个人彼此认识,要么有s个人彼此不认识?对于给定的r和s,这个答案就是拉姆齐数R(r,s)。

问题的难度在于,随着r和s增大,需要验证的图结构数量以指数级爆炸式增长,超出任何暴力计算的能力边界。就连R(5,5)至今仍只知道它落在43到48之间,这已经是数十年努力的结果。

AlphaEvolve这次改进的五个拉姆齐数分别是R(3,13)、R(3,18)、R(3,19)、R(3,21)和R(3,22)。以R(3,13)为例,其下界从60提升到了61。数字的变化看起来微不足道,但在这个领域,每一步都意味着需要构造出一个满足特定条件的图,并且在数学上严格证明它的合法性。这篇由Ansh Nagda、Prabhakar Raghavan和Abhradeep Thakurta撰写的论文还表明,系统在许多其他案例中也与已知最佳结果相符,包括一些原始研究者从未公开过构造方法的情形。

AlphaEvolve是谷歌DeepMind于2025年5月推出的进化式编码智能体,由Gemini大语言模型驱动。它的工作方式模拟生物进化:从一组候选程序出发,根据目标标准对它们打分,然后让大模型对最有潜力的程序进行变异,保留优秀者,淘汰较弱者,反复迭代。

关键在于,AlphaEvolve不只是在寻找问题的答案,它寻找的是解题的策略本身——即所谓的"元算法"能力。对于拉姆齐数问题,这意味着系统会自动设计并演化出一套组合搜索程序,而这套程序在过去需要领域专家手工构建,往往耗时数月乃至数年。

谷歌DeepMind科学与战略计划负责人普什米特·科利对此评价道:"对于许多这样的界限,之前最好的结果至少已经是十年前的了。AlphaEvolve改变了这一现状,它作为单一的元算法,可以自动发现找到这些新界限所需的搜索过程。"

这不是AlphaEvolve第一次让数学家侧目。在超过50个开放数学问题的测试中,AlphaEvolve在75%的情况下重新发现了最先进的已知解,并在20%的情况下对其进行了实质改进。它改进了一个已有56年历史的矩阵乘法算法,那是现代AI计算的核心运算。它还改进了几何学中著名的"接吻数"问题,优化了谷歌自身数据中心的调度效率,并加速了Gemini模型的训练过程。

值得注意的是,这最后一点意味着AlphaEvolve正在优化用于训练自身的系统。这是一个真实运行中的递归改进循环,不是科幻叙事,而是已经发生的工程现实。

数学界对此的反应远比过去几年任何AI数学突破都更为审慎和关注。著名数学家陶哲轩曾专门撰文分析AlphaEvolve的能力边界,指出它本质上是一种优化工具,在拥有明确打分函数的问题上表现出色,但对于没有清晰验证标准的猜想或定理证明,其能力仍然有限。这是一个重要的区分:拉姆齐数的下界改进属于前者,AI可以构造反例并自动验证;而证明一个全新的定理,AI目前仍然无法独立完成。

但即便有这样的边界,AlphaEvolve展示的能力已经足够令人深思。一个系统,同时在组合数学、矩阵计算、几何学和数据中心调度等截然不同的领域取得实质进展,这是以往任何单一工具从未做到过的事情。

对于数学研究者和工程师而言,更重要的或许不是五个拉姆齐数字的具体变化,而是产生这些变化的方式:不需要为每个问题单独设计算法,只需要一个足够通用的进化框架。这个框架,正在迅速成为AI辅助科学研究的新基础设施。

标签: 谷歌 gemini alphaevolve 拉姆齐 组合数学
sitemap