2025年9月,《自然·计算科学》的一篇论文颠覆了学界认知:谷歌DeepMind的AlphaEvolve大语言模型,在理论计算机科学的"硬骨头"——复杂性理论中,发现了全新的数学结构,直接将MAX-4-CUT问题的不可近似性界限从0.9883刷新至0.987。更震撼的是,这个AI还能自己验证结果,把验证速度提升了一万倍。这不是AI第一次"染指"数学,但却是首次在严格的理论计算机领域实现定理突破,标志着AI从"解题工具"进化为"研究伙伴"。而中国团队早已跟上节奏,自研模型已具备数学推理的自我验证能力,一场AI赋能的数学革命正在上演。
数学界的"体力活",AI干得更漂亮
理论计算机科学里的很多难题,本质上是"找东西"的游戏——找到一个关键的组合结构(业内叫"小工具"),就能搭建起整个定理的证明框架。但这些"小工具"藏在海量的可能性里,人类靠直觉和试错去碰,往往要耗费数年甚至数十年。
以这次被突破的MAX-4-CUT问题为例,它是经典的NP难问题,简单说就是把一张图的节点分成4组,让组间连接的边最多。由于找不到精确解,科学家们一直在找"近似解的极限"——也就是再好的近似算法,也达不到某个精度。此前最精确的结果0.9883,是研究者们熬了12年才得出的。
AlphaEvolve的厉害之处,在于它把这个"大海捞针"的过程变成了"精准垂钓"。它的核心逻辑是"迭代演化":先生成一批代码片段,用这些片段构建"小工具"并打分,再让大语言模型优化得分最高的片段,重复几轮就得到了更优结构。这次它找到的"小工具"包含19个变量,其中某些连接的权重是其他连接的1429倍,这种复杂且精妙的设计,人类凭直觉几乎不可能想到。
更关键的是"提升"技术的妙用。理论数学讲究"普适性",要保证结论对所有规模的问题都成立。AlphaEvolve只需要找到一个有限规模的最优"小工具",研究者就能用成熟的数学框架把这个发现"提升"为普适定理。就像找到一块完美的砖,就能用它盖出任意高度的大楼,效率比从头设计建筑图纸高得多。
在另一项MAX-2-CUT问题的研究中,AI的优势更明显。这个问题的突破需要找到带"超大割"的拉马努金图,此前人类最多只找到10个节点的这类图。而AlphaEvolve在巨大的搜索空间里,直接挖出了163个节点的拉马努金图,一下把计算硬度的上下限精确到了小数点后第三位。
不做"嘴炮型"AI:验证速度飙涨一万倍
数学研究最忌讳"错漏",此前很多AI模型能生成看似完美的证明,但一细究全是漏洞。AlphaEvolve的核心竞争力,恰恰是解决了"正确性"这个痛点——它不仅能发现,还能高效验证。
为了保证结果绝对可靠,团队设计了"双重验证"机制。首先,AlphaEvolve内置了复杂的分支定界策略,把验证过程的效率提升了10000倍,原本要算几天的任务现在几分钟就能完成。但这还不够,最终的关键"小工具"必须通过最原始的暴力算法验证,确保每一步都无懈可击。
这种"发现+验证"的闭环,彻底改变了AI在数学研究中的定位。在此之前,AI要么是"出题机",帮研究者生成案例;要么是"计算器",完成繁琐的运算。而AlphaEvolve成了"合作者"——它负责搞定最耗精力的结构搜索和初步验证,人类研究者则聚焦于框架设计和定理升华,分工效率一下提升了数倍。
"这就像以前两个人一起拼图,一个人找碎片一个人拼,现在AI能自动筛选出最可能的碎片,还帮你检查拼得对不对。"中科院计算技术研究所李研究员解释道,"人类的创造力加上AI的执行力,就是1+1>2的效果。"
中国不缺席:自研模型已学会"自我反思"
谷歌的突破并非孤例,国内在AI赋能数学研究领域早已多点开花。2025年2月,DeepSeek团队发布的推理模型就展现了强大的数学能力,它能像人类一样逐步解题,还会主动检查答案、发现错误后重新推导,这种"自我反思"能力正是数学研究的关键素养。
在理论计算机科学的应用上,国内团队也有扎实积累。2021年,《软件学报》就刊登过国内学者对Multicut问题的研究突破——这个和MAX-k-CUT同属NP难问题的课题,研究者通过改进参数化算法,大幅降低了计算复杂度 。虽然当时还未大规模应用AI,但这类研究为如今的AI赋能打下了坚实基础。
更贴近产业的是专用数学大模型的落地。2023年上线的国内首个千亿级数学大模型MAX GPT,在解题准确率和稳定性的基准测试中表现突出,已开始应用于AI教学领域。虽然它目前聚焦于基础教育和应用数学,但背后的推理引擎完全可以迁移到理论研究场景。
李研究员透露,他们团队正在将DeepSeek的"自我验证"技术与AlphaEvolve的"结构搜索"逻辑结合,开发针对组合优化问题的专用AI工具。"国内在NP难问题的算法研究上有深厚积累,现在加上AI的翅膀,很可能在某些细分领域实现反超。"
AI当"数学家",边界在哪?
AlphaEvolve的突破,让不少人好奇:AI未来会取代数学家吗?答案显然是否定的,但它确实会重塑数学研究的范式。
从能力边界来看,AI目前最擅长的是"在既定框架内找最优解",比如给定证明方向后找"小工具"、给定问题类型后优化算法。但提出全新的研究方向、构建全新的证明框架,这些需要跨领域联想和颠覆性思维的工作,依然是人类的主场。就像AlphaEvolve能优化"小工具",但"提升"技术所依赖的数学框架,还是人类研究者几十年的智慧结晶。
不过,AI带来的改变已经足够深远。以往理论计算机领域的突破往往"十年磨一剑",因为结构搜索和验证太耗时。有了AI辅助,这个周期可能缩短到几年甚至几个月。这意味着密码学、量子计算等依赖复杂性理论的领域,也会跟着加速进步——比如更安全的加密算法、效率更高的量子纠错码,都可能因这些数学突破而提前落地。
更值得关注的是"人机协作"模式的普及。现在顶尖的数学实验室已经开始标配AI工具,就像当年科学家们用上计算机一样。未来的数学论文里,可能会频繁出现"本研究使用AI工具发现关键结构"的致谢,而"AI辅助证明"也会成为理论计算机科学的常规方法。
但挑战也随之而来。随着AI生成的数学结构越来越多、越来越复杂,验证的难度会不断升级——这次是19个变量的"小工具",下次可能是上百个变量,即便是一万倍的验证加速,也可能跟不上生成速度。如何进一步提升验证效率、建立更通用的验证标准,会成为下一个研究热点。
结语:AI不是来"砸场"的,是来"搭台"的
谷歌AlphaEvolve的突破,与其说是AI挑战了数学家的权威,不如说是为数学研究搭了个更高效的舞台。它把研究者从繁琐的结构搜索和验证中解放出来,让人类的创造力能更聚焦于真正核心的科学问题。
从国内的自我反思模型到谷歌的结构发现系统,AI与数学的融合正在加速。未来几年,我们可能会看到更多理论计算机科学的突破,甚至可能见证某些困扰人类几十年的NP难问题迎来新的进展。
但请记住,AI永远是工具——它能找到那块关键的"砖",却画不出整个建筑的蓝图;它能优化证明的细节,却提不出颠覆性的猜想。真正推动数学前进的,依然是人类对未知的好奇和对真理的追求。而AI的使命,就是让这份追求的道路变得更平坦、更高效。
这场AI与数学的"联姻",才刚刚开始。