新闻资讯-歌剧话剧

谷歌TPU与英伟达GPU架构下光模块与OCS需求重塑、投资决策

发布时间:2025-11-27 18:28:43  浏览量:20

当前,全球AI芯片市场正经历一场深刻的变革。长期以来,Nvidia凭借其GPU产品和CUDA软件生态,在AI训练和推理市场建立了近乎垄断的地位。然而,近年来,谷歌等科技巨头纷纷加大自研AI芯片的投入,试图摆脱对Nvidia的过度依赖。2025年11月,谷歌正式发布第七代TPU(Ironwood)和Gemini 3.0大模型,标志着AI芯片竞争进入新阶段。这一发展不仅可能改变AI芯片市场的竞争格局,还将对数据中心算力基础设施,特别是光模块和OCS(光学电路交换)技术产生深远影响。

谷歌的TPU战略体现了垂直整合在AI竞争中的重要性。作为专门为机器学习工作负载定制的专用集成电路(ASIC),TPU在特定场景下比通用GPU具有更高的效率和更低的能耗。根据行业分析,谷歌TPU在推理场景下的能效可达竞品的2倍,训练成本仅为竞品的20%。这种效率优势使得TPU不仅在谷歌内部得到广泛应用,还开始吸引外部客户,如Meta正在与谷歌洽谈,计划在2027年斥资数十亿美元在Meta的数据中心使用TPU。

与Nvidia的GPU相比,谷歌TPU在互联架构上存在根本差异,这直接影响了光模块和OCS的需求。Nvidia依靠NVLink技术实现单机柜内电互联,仅跨机柜交互依赖光模块;而TPU则依赖OCS光交换机和3D-Torus拓扑实现集群协同,光模块配比显著更高。这种架构差异使得在相同算力规模下,TPU方案的光模块用量远超GPU方案,据估计,TPU v7的光模块用量是Nvidia Rubin平台的3.3倍。

随着Gemini 3.0的发布,谷歌展示了其在AI全栈布局上的实力。Gemini 3.0不仅在推理、多模态和Agent平台三条主线上同时实现了代际式跃迁,而且验证了算力领域的Scaling Law(规模法则)依然有效。这意味着AI产业趋势仍然在螺旋式上升,算力投入"随规模提升,模型相应继续上行"的经验规律并未打破,这对AI算力基础设施,特别是光通信产业链带来了新的增长机遇。

谷歌ironwood tpu对英伟达构成超预期威胁

谷歌第七代TPU(代号Ironwood)代表了谷歌在AI加速器领域的最新成果。与前几代TPU相比,Ironwood在算力、能效和互联能力上都有显著提升。根据官方数据,相较于前代TPUv5p,Ironwood的峰值性能提升约10倍;与最近一代v6e相比,单芯片在训练和推理任务上的性能也超过4倍。这种性能飞跃主要来自于架构优化和先进制程工艺的应用。

Ironwood TPU配备了超大带宽内存、高速互联接口和液冷系统,能够高效适配复杂、高并发、低延迟的大模型部署与服务场景。特别值得注意的是,Ironwood采用了3D-Torus拓扑互联架构,通过OCS(光学电路交换)技术实现芯片间的低延迟、高带宽连接。这种设计使得TPU集群能够作为一个统一的超级计算机运行,而非离散的计算节点集合。

在算力表现方面,TPU v7的FP8精度算力估算为4614 TFLOPS,虽然低于Nvidia Rubin平台(2die)的约16667 TFLOPS,但通过架构优化和软件协同,在实际AI工作负载中,尤其是大规模推理场景下,TPU v7能够提供更具性价比的性能表现。值得一提的是,谷歌并非单纯售卖TPU芯片,而是在打造一个可租用、可弹性扩展、能容纳大规模模型运行、支持高并发服务与全球用户访问的全方位AI基础设施体系

面对TPU的挑战,Nvidia凭借其在AI计算领域多年的积累,依然保持着显著优势。Nvidia的核心战略是通过"GPU+CUDA+生态"构建的通用计算平台,保持其在AI基础设施中的基础地位。在最新发布的Rubin平台中,Nvidia进一步强化了GPU的通用计算能力和互联带宽。

Nvidia GPU的核心优势在于其通用性与兼容性。CUDA平台已经成为AI开发的事实标准,几乎所有的主流AI框架(如PyTorch、TensorFlow)都直接适配CUDA,开发者编写的代码能无缝在Nvidia GPU上运行,无需深入钻研硬件底层或反复修改代码。这种广泛的软件兼容性使得Nvidia GPU能够运行各类AI模型,从科研机构的小模型,到大规模商用模型,几乎所有的AI相关场景都有现成的CUDA优化工具和案例。

在互联架构方面,Nvidia采用NVLink技术实现单机柜内电互联,仅跨机柜交互依赖光模块。这种设计降低了单个机柜的内部互联成本,但也在一定程度上限制了跨机柜的通信效率。在Rubin平台中,GPU与1.6T光模块配比为1:5,较此前的1:2.5已翻倍,但仍低于TPU的配比水平。值得注意的是,Nvidia也在积极布局CPO(共封装光学)等新兴互联技术,未来可能进一步降低对传统可插拔光模块的依赖。

TPU与GPU的竞争,本质上反映了专用化通用化两种技术路线的哲学差异。TPU作为ASIC(专用集成电路),专为深度学习中的矩阵运算优化,在特定任务上能效比高,成本也更低。就像专门跑马拉松的跑鞋,在特定场景下表现卓越。然而,这种专用化也带来了场景受限的问题——TPU主要适配TensorFlow框架和谷歌的模型,对于小众框架或自定义模型,兼容性较差。

相比之下,Nvidia GPU则更像是"万能工具",能够适应各种AI工作负载和不断演进的算法。通用性带来的最大优势是灵活性——一家公司如果同时进行图像识别、自然语言处理和推荐系统等多种AI任务,使用GPU能够同时搞定这三类任务,而不需要为每个场景采购专门的芯片。这种灵活性在AI技术快速迭代的背景下显得尤为重要,因为专用芯片一旦生产完成,其硬件架构就固定了,难以适应新的算法突破。

从市场格局来看,未来AI芯片市场很可能呈现混合多元的发展态势。GPU将继续在算法研究和多样化工作负载场景中占据主导地位,而TPU等ASIC芯片则将在规模化推理和特定训练场景中发挥其效率和成本优势。这种分化不仅体现在技术路线上,还会影响整个算力基础设施的构建方式,特别是光模块和光交换技术的应用模式。

谷歌tpu企业龙头共4家

光模块作为数据中心内部互联的关键组件,在AI算力集群中扮演着数据枢纽的角色。随着AI模型规模的不断扩大,训练一个大型模型可能需要成千上万颗芯片协同工作,这些芯片之间的通信效率直接决定了整个集群的计算效率。传统数据中心中,光模块主要用于机柜间连接,数量相对有限;而在AI算力集群中,由于计算任务需要大量的跨节点通信,光模块的使用密度显著提高。

在AI集群中,光模块的性能直接影响到训练时间推理延迟。高速光模块能够降低节点间通信的延迟,提高带宽,从而加速模型训练和推理过程。目前,800G光模块已在大型AI数据中心中规模化部署,1.6T光模块也开始进入商用阶段。未来,随着算力需求的进一步增长,3.2T甚至更高速率的光模块也将逐步落地。

值得注意的是,不同AI芯片架构对光模块的需求存在显著差异。根据供应链信息,2026年谷歌TPU需求预计达490万颗,对应的1.6T光模块需求预期已上调至1500万-3000万只。相比之下,英伟达2026年1.6T光模块订单需求约500万只,不到谷歌的三分之一。这清楚表明,在相同算力规模下,TPU架构对光模块的需求远高于GPU架构。

OCS(光学电路交换)技术是谷歌TPU集群架构的核心创新之一。OCS的全称为Optical Circuit Switching,即光学电路交换技术。与传统交换机不同,OCS的技术先进性在于:光纤信号进入交换机后,直接进行光路交换,无需做光电转换。这种光交换方式有效解决了传统电交换的带宽瓶颈和功耗问题。

OCS在TPU集群中发挥着交通枢纽的关键作用。通过OCS技术,谷歌实现了TPU集群的灵活互联和动态重构,使得整个集群能够根据不同工作负载的需求优化通信路径。根据技术分析,谷歌的OCS定制化网络使其整个网络的吞吐量提升了30%,功耗降低了40%,数据流完成时间缩短了10%,网络宕机时间减少了50倍,且资本开支减少了30%。这些改进对于大规模AI训练任务至关重要,因为通信效率往往成为训练时间的瓶颈。

OCS技术有多种实现路线,主要包括MEMS数字液晶压电陶瓷三种。其中,MEMS方案目前在谷歌集群中应用最为广泛,其优点在于端口规模可做到百×百级、插损低、成熟度最高,已在超大规模数据中心承载生产流量。不过,MEMS方案也有缺点,如机械微镜致动,典型切换时间ms量级;高端口封装/准直复杂。这些技术特点决定了不同OCS方案适用的场景和成本结构。

从光模块需求角度分析,TPU和GPU存在明显差异。根据行业测算,当前TPU与光模块配比约1:3-1:4,且集群规模扩大时配比可攀升至1:8。相比之下,英伟达新一代Rubin平台中,GPU与1.6T光模块配比为1:5。换算成相同算力基准,在纸面算力相等的情况下TPU v7光模块用量是Rubin(2die)的3.3倍。甚至有行业数据显示,谷歌TPU的光互连需求是英伟达GPU的6倍。

这种差异主要源于互联架构的根本不同。英伟达GPU依靠NVLink技术实现单机柜内电互联,仅跨机柜交互依赖光模块,配比相对保守。而TPU无类似英伟达的高速电互联技术,依赖OCS光交换机和3D-Torus拓扑实现集群协同,因此光模块配比更高。可以认为,英伟达通过电互联节约了光模块成本,但限制了集群规模的扩展性;而谷歌通过全面光互联实现了更大规模的集群构建,但付出了更高的光模块成本。

从OCS需求角度看,TPU集群是OCS技术的主要采用者。目前,谷歌是OCS技术最积极的推广者和最大规模的应用者。据预测,2025年OCS交换机预计出货量1.2万台,到2030年预计出货量将增长至30万台。这一数据反映了OCS技术在AI数据中心中的渗透将加速。相比之下,英伟达在光互联技术上更倾向于采用CPO(共封装光学)路线,这可能在未来进一步降低对传统可插拔光模块和独立OCS交换机的需求。

英伟达铁幕之后,谷歌ai芯片已成气候

谷歌TPU市场份额的提升将对光模块和OCS产业链产生结构性影响。根据行业分析,若英伟达GPU份额下降,谷歌TPU份额提升,光模块板块增速将更快,占整体Capex比例提升。实际上,即使没有近期Gemini 3.0的亮眼表现以及Meta的购买意向,ASIC渗透率提升也是确定性趋势。据测算,从2025年到2027年,年新增算力规模(Flops)中ASIC占比将提升约10个百分点。

具体到谷歌的需求,业界认为市场首先大幅低估了2026年的需求,再次无视了2027年的需求增长。根据供应链反馈,谷歌正在进一步追加高速光模块订单,2027年实际需求可能在2026年高基数基础上再提升150%甚至更多。有分析指出,2026年谷歌对中际旭创的1.6T光模块需求可能达800万支,2027年是2026年的1.5倍,乐观情况下甚至达到了4倍。这种需求增长将为光模块和OCS产业链公司带来显著的业务增量。

从技术发展角度看,光通信行业正面临三大预期差:一是2026年需求及龙头公司的备货超市场预期;二是2027年需求增速及置信度超市场预期;三是Scale Up场景的光互联产品(如NPO/AOC等)预计将于2027年开始逐步推出,打开长期估值天花板。这些因素共同构成了光通信产业链的增长动力。

中际旭创是谷歌最重要的光模块合作伙伴,在1.6T光模块领域处于领先地位。公司是谷歌1.6T光模块的独家供应商,2025年相关订单超过50亿元。作为谷歌TPU产业链中的关键供应商,中际旭创不仅提供光模块,还通过海外子公司TeraHop推出硅光子OCS交换机,展现了其在光互联领域的全面布局。

从订单情况看,中际旭创2025年已从谷歌获得重大订单,预计2026年谷歌对其的1.6T光模块需求可能达800万支。测算下来,谷歌明年对中际旭创的收入贡献约35-40%,2027年谷歌段利润可能达大几百亿。公司在光模块领域的技术领先性和规模化生产能力构成了其核心竞争力,有望在谷歌TPU扩张周期中最大化受益。

公司的竞争优势不仅来自于市场份额,更源于其持续的高研发投入和技术前瞻性。根据企业竞争优势的相关研究,公司的行业地位和市场份额决定了其在行业中的竞争地位。中际旭创作为行业领导者,对产品价格有很强的影响力,从而拥有高于行业平均水平的盈利能力。此外,公司注重战略聚焦,将资源集中在最具潜力的核心业务上,这种聚焦策略有助于提升公司估值和相对股东总回报。

与谷歌业务关系核实:根据公开市场信息,中际旭创被多家财经媒体确认为谷歌光模块的核心供应商,公司1.6T产品正在持续起量。尽管公司出于保密考虑未公开透露具体客户信息,但市场普遍认可其与谷歌的深度合作关系。

新易盛是谷歌重要的光模块供应商,为谷歌TPU边缘节点提供800G光模块。公司在高速光模块领域具有较强的技术积累和客户资源,1.6T产品已获得认证,深度参与谷歌下一代算力网络建设。

作为谷歌链光模块主要供应商之一,新易盛与中际旭创共同分享谷歌TPU扩张带来的光模块需求增长。公司同时布局华为昇腾生态,客户结构相对多元,降低了单一客户依赖风险。在谷歌2026-2027年光模块需求大幅增长的背景下,新易盛有望获得显著业绩增长。

从公司基本面分析,新易盛的产品竞争能力在成本、技术、质量方面具有相对优势,这使其有可能获取高于行业平均盈利水平的超额利润。公司的产品市场占有率在谷歌供应链中稳定在重要位置,这体现了公司的实力,也使其盈利水平相对稳定。值得注意的是,公司在保持核心业务优势的同时,适度拓展不同事业版图,这有助于分散单一市场或产品线所承担的风险。

与谷歌业务关系核实:新易盛被市场消息确认为谷歌光模块供应商,为谷歌TPU边缘节点提供800G光模块。与中际旭创类似,公司因涉及商业保密而未公开透露客户信息。

光库科技是谷歌OCS光交换机的核心代工厂,承担谷歌OCS光交换机70%的代工份额,单台价值3万美元以上,订单覆盖至2027年。公司通过收购武汉捷普强化了在OCS代工领域的地位,武汉捷普是谷歌OCS交换机的独家代工厂商。

光库科技在OCS产业链中地位显著,单台OCS交换机代工价值量高达30000美元,是OCS产业链中单机价值量最高的环节之一。同时,公司还凭借薄膜铌酸锂调制器超40%的全球市占率筑牢技术壁垒,并切入微软、Meta等海外巨头供应链。随着OCS技术在AI数据中心中的渗透率提升,光库科技将直接受益。

从财务分析角度看,光库科技的盈利能力指标表现优异,主营业务毛利率和净利率保持在较高水平,反映了公司产品的定价能力和成本控制能力。公司的资产收益率(ROA)净资产收益率(ROE) 也表现良好,反映公司资产的综合利用效率和所有者权益的投资报酬率。值得注意的是,公司通过与员工共享价值,可能形成了潜在的劳动力租金优势,即员工实际薪酬和市场合理薪酬之间的正差额,这有助于吸引和保留人才。

德科立是OCS核心供应商,在谷歌供应链中担任OCS光引擎模组独家供应商,新建数据中心份额超60%。公司下一代320×320高通道OCS模组已送样谷歌,技术实力获得认可。值得注意的是,德科立是唯一送样英伟达OCS的厂商,显示了其技术路线的通用性。

在OCS单机价值量方面,德科立提供的模组价值约10000-20000美元,仅次于光库科技的整机代工价值。公司作为OCS光引擎模组 specialists,在光机电一体化设计方面具有深厚积累,有望在OCS技术普及过程中获得成长机会。

从公司竞争优势角度看,德科立展现了企业在战略清晰度方面的优势。市场能够理解公司的经营策略,因为公司提供的产品或服务都在同一个生态系里。这种战略清晰度使得投资者能够看清公司的真正价值,有助于提升公司整体估值。此外,公司的营运能力分析指标,如存货周转率和应收账款周转率,也反映了公司高效的经营管理水平。

腾景科技是OCS光学模组核心器件供应商,相关收入占比28%。公司为谷歌OCS供应棱镜、滤光片等高精度光学元件,同时绑定谷歌光模块供应商Cloudlight,协同性强。在OCS单机中,腾景科技提供的组件价值约5000美元,其中含交换机内部器件(棱镜/滤光片等1000美元)+定制光模块波分复用&环形光学器(4000美元)。

作为OCS产业链中上游元件供应商,腾景科技在精密光学元件领域具有明显技术壁垒,公司2025年11月股价创历史新高167元,反映了市场对其前景的认可。随着OCS出货量的增长,公司作为核心元件供应商将稳步受益。

从公司估值方法看,腾景科技适用于相对估值方法绝对估值方法。在相对估值方法中,常用的指标有市盈率(PE)、市净率(PB)等,这些指标反映了公司股票目前的价格是处于相对较高还是相对较低的水平。公司的品牌优势也在逐步建立,品牌已成为产品质量、性能、可靠性等方面的综合体现,拥有品牌优势的公司产品往往能获取相应的品牌溢价。

赛微电子通过瑞典Silex子公司独家为谷歌代工OCS核心MEMS芯片,技术门槛极高。每个OCS交换机使用两个MEMS振镜芯片,单价3000美元,单台OCS交换机总计6000美元。该业务毛利率高达90%,展现了尖端MEMS芯片的技术溢价。

赛微电子是国内唯一量产MEMS-OCS晶圆的厂商,在MEMS路线的OCS技术中具有垄断地位。随着OCS出货量的增长,公司MEMS振镜业务将直接受益。同时,公司MEMS-OCS境内外产线分别服务于境内外知名客户,具有多年经验,客户结构多元,降低了业务风险。

从公司基本面分析,赛微电子的偿债能力指标,如流动比率、速动比率、资产负债率和利息保障倍数,反映了公司的财务健康状况和长期偿债能力。公司的产品分析显示,其产品在成本、技术、质量方面具有相对优势,这使其有可能获取高于行业平均盈利水平的超额利润。值得注意的是,公司通过与员工共享价值,可能创造了额外的劳动力租金,即使公司的会计利润相对较低,但实际上可能具有更强的整体竞争优势。

沪电股份是谷歌TPU算力板核心供应商,在谷歌TPU板卡中的占比约30%。公司作为高端PCB制造商,在高速电路板设计和制造方面具有深厚积累,能够满足AI算力芯片对电路板的高性能要求。

在AI算力板卡领域,沪电股份凭借其在高速、高密度、高多层PCB板的技术积累,获得了谷歌TPU板卡的重要份额。随着谷歌TPU出货量的增加,公司作为核心PCB供应商将直接受益。同时,公司也是英伟达GPU板卡的重要供应商,这种多元客户结构有助于平衡业务风险。

从公司竞争优势看,沪电股份在高端PCB制造领域具有明显技术壁垒,特别是在高层数、高密度互联(HDI)、高频高速材料应用等方面积累深厚。公司的产品竞争能力在成本、技术、质量方面具有相对优势,这使其有可能获取高于行业平均盈利水平的超额利润。

第一梯队:中际旭创、光库科技
中际旭创在光模块和OCS领域均占据主导地位,作为谷歌最大光模块供应商和OCS整机代工商,公司将从TPU放量中最大化受益。光库科技作为谷歌OCS独家代工厂,单机价值量高达30000美元,且订单已排至2027年,业绩确定性极强。

第二梯队:新易盛、德科立、沪电股份
新易盛作为谷歌重要光模块供应商,将充分受益于谷歌光模块需求增长。德科立作为OCS光引擎模组独家供应商,技术壁垒高,且同时送样英伟达,客户风险相对分散。沪电股份作为谷歌TPU算力板核心供应商,占比约30%,将直接受益于TPU出货量增长。

第三梯队:腾景科技、赛微电子
腾景科技和赛微电子作为OCS核心元件供应商,将受益于OCS出货量增长,但单机价值量相对较低(5000-6000美元)。不过,赛微电子MEMS振镜业务90%的毛利率展现了极高的技术溢价,业绩弹性可能超预期。

从投资逻辑看,谷歌TPU份额提升将首先利好光模块供应商(中际旭创、新易盛),其次利好OCS产业链(光库科技、德科立、腾景科技、赛微电子)和算力板卡供应商(沪电股份)。在光模块领域,1.6T产品的毛利率显著高于800G产品,具备1.6T量产能力的公司将享受产品结构改善带来的利润率提升。在OCS领域,整机代工和核心模组的技术壁垒最高,议价能力最强,相关公司的盈利稳定性也更好。

11月谷歌第7代tpu芯片ironwood正式商用

针对谷歌TPU产业链的投资,建议采取细分领域龙头优先业绩确定性优先的策略。根据产业链调研,谷歌27年实际需求在26年高基数基础上再提升150%甚至更多,这一增长将为产业链公司带来显著业绩拉动。投资者可重点关注2026年一季度至二季度的订单兑现情况,以及2027年需求的持续性验证。

在细分领域布局上,建议优先关注以下投资主线:

高速光模块:特别是1.6T光模块领域具有先发优势的企业,如中际旭创、新易盛。随着1.6T光模块规模化交付,产品毛利率可能显著提升。

OCS整机与代工:OCS作为谷歌TPU集群的核心设备,需求增长确定性高,光库科技作为独家代工厂商将直接受益。

OCS核心组件:包括MEMS振镜(赛微电子)、光引擎模组(德科立)和精密光学元件(腾景科技),这些领域技术壁垒高,供应商议价能力强。

算力板卡:沪电股份作为谷歌TPU算力板核心供应商,占比约30%,将直接受益于TPU出货量增长。

从布局时机看,目前市场正处于认识谷歌TPU产业链价值的早期阶段。虽然部分公司股价已有表现,但2026-2027年的需求预期尚未完全体现在估值中。根据行业跟踪,谷歌TPU的出货指引以及光模块的需求都非常好,投资者可在市场调整时布局核心标的。

在投资决策过程中,投资者应重视公司估值方法的逻辑,即"价值决定价格"。上市公司估值方法通常分为两类:一类是相对估值方法(如市盈率估值法、市净率估值法等);另一类是绝对估值方法(如股利折现模型估值、自由现金流折现模型估值等)。对于谷歌TPU产业链公司,投资者需要结合宏观经济、行业发展与公司基本面的情况,具体公司具体分析。

此外,投资者还应关注企业的竞争优势评估,这不仅包括传统的会计利润指标,还应考虑公司为非股东利益相关者创造和分配的价值。有些公司可能选择与利益相关者共享更多价值,但这并不意味着这些公司的"竞争力较弱"。实际上,整体价值(所有租金的总和)才真正构成竞争优势。

标签: 英伟达 tpu 光模块 gpu ocs
sitemap