Alphabet 市值在短短几周内暴涨约530亿美元,同期英伟达市值蒸发约620亿美元。这波大的波动背后,是传出的一个消息:Meta 正与谷歌谈判,计划在 2027 年把大量 TPU 放进自家数据中心,投入规模可能达到数十亿美元。简单说,英伟达长期稳坐的 AI 芯片位置,被第一次从根本上动了。
事态并非一夜之间形成。过去一年里,谷歌把 TPU 的对外商业化提速。2024 年开始,谷歌不仅和伦敦的 Fluidstack 有合作,还为这类商业化部署提供了 32 亿美元的担保。谷歌把 TPU 推给大型互联网公司、金融机构、云服务伙伴,目标是把这套自研硬件变成能带来持续收入的产品线。野村证券的一个预测被广泛引用:到 2026 年,ASIC 芯片出货量可能会首次超过 GPU,而谷歌的 TPU 有望在那年出货突破 300 万片。市场上能抢到英伟达营收份额的机会,显然不只是一句口号。
英伟达的反应很快,是那种官方声明式的抬头,强调自己仍然领先一代。但市场的神经更敏感——过去几个月里,英伟达市值连续回调,投资者担心这不是短期波动,而是结构性竞争出现了。与此同时,谷歌在继续采购英伟达 GPU 的同时,把 TPU 当作双轨策略中的重要一环,这种同时持有两套筹码的做法让对手防不胜防。
技术层面上,TPU 的进步不是线性的,而是几次跳跃式的升级。到了 2025 年底,谷歌发布的 TPU v7,代号 Ironwood,成为分水岭。单芯片在 FP8 模式下的峰值算力标称 4614 TFLOPS,超过了英伟达当时的 B200 的 4500 TFLOPS。配套的是 192GB 的 HBM3e 内存和 7.2TB/s 的带宽,这套规格能轻松应对千亿级参数模型的推理需求。谷歌把它用在自家的 Gemini 3 大模型训练上,外面也有公司表示要上大规模部署——Anthropic 就公开说要部署 100 万个 TPU,交易金额据说高达数百亿美元。
把时间倒回来看,TPU 并不是一开始就打算对外售卖。2015 年亮相的第一代 TPU,只是为了满足谷歌内部那种压倒性增长的算力需求。再往前追溯到 2013 年,谷歌遇到的算力瓶颈是真实的:单靠通用 CPU,完全拖不起;依赖英伟达 GPU,又有效率和供应链单一化的顾虑。公司内部做过测算,光安卓用户的语音识别就可能让现有算力吃紧。于是一个选择被放到了桌面:自研 ASIC。目标很明确——把推理成本压到 GPU 的十分之一。
谷歌把这事当成优先级高的项目去做。挖来了 Norm Jouppi、Richard Ho 这样的芯片专家,和博通(Broadcom)合作,仅用了大约 15 个月就把第一代 TPU 推到生产和部署上。那一代芯片用的是 28nm 工艺,但在特定工作负载下的表现却提升明显:运算性能比之前高出 15 到 30 倍,能效提升 30 到 80 倍。它的架构里有“脉动阵列”之类的设计,配套的是提前编译的运行策略,这些都为后续的迭代打下了基础。刚出来时,业内并不全然买账,英伟达甚至拿基准测试把性能差距摆在台面上说,认为 GPU 的通用性在很多场景下更占优势。
随着迭代,TPU 的定位也在变:从纯推理向训练方向扩展。v2 把训练能力带进来,bfloat16 数据格式在行业里开始被广泛接受。v3 提出液冷技术来处理高功耗和散热问题。v4 在集群互联上做了改进,把网络能做成更动态可编程的样子。v5p 则朝着覆盖更多使用场景去做适配。到 v7,谷歌已经把这些分散的技术积累整合起来,形成对大型模型训练和推理都相对友好的平台。
TPU 的成功还带来人才流动效应。2016 年,TPU 核心团队里有几位离职创业,成立了 Groq,推出了自家的 LPU,宣称推理速度比英伟达 GPU 快 10 倍、成本只是十分之一。到 2024 年,Groq 的市场估值达到了 28 亿美元。OpenAI 也盯上了这些技术人才,挖来过 Richard Ho 等前 TPU 成员,并与博通达成了 10GW 的定制芯片合作,目标是在 2026 年推出自研芯片。亚马逊、微软、特斯拉等公司的 AI 芯片队伍里,也能找到来自 TPU 团队的身影。说白了,谷歌在打造硬件的同时,也在无意间培养出了一批愿意把经验带到其他公司去的人。
商业谈判层面,Meta 的动向被看作是压垮现有格局的关键一手。外界把 Meta 与谷歌的接触解读为“转向”或“战略多元化”,因为过去几年里,Meta 大量采用英伟达的 GPU 架构来训练自家模型。万一 Meta 真要在 2027 年把大量 TPU 装到自家数据中心,英伟达在大客户层面的独占优势会明显受损。市场对这种可能性非常敏感,所以出现了这轮市值的剧烈变动。
话说回来,整个行业现在是个多方博弈的场景。厂商在硬件设计、制程、内存和互联带宽上比拼,客户在成本、性能、供应链多样性之间做抉择,人才则在这些公司之间流动,带着经验和想法去推动下一步的技术路线。这一连串的变化,会不会把现在的格局改写得更彻底,就看接下来几年里这些合同、出货数据和实际部署效果。