上周,天风国际分析师郭明錤发布研报,指出英伟达在B300/GB300芯片的DrMos技术测试中遭遇了严重的过热现象。这一情况可能对量产进程造成影响,并引起了业界的广泛关注。

郭明錤研报指出问题

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第1张

上周,郭明錤发布了该份重量级研究报告。报告明确指出,B300/GB300芯片的状况不佳。他提及,AOS公司提供的5*5 DrMos方案在测试中出现了过热现象。这一发现是基于对英伟达芯片开发与测试流程的深入分析。

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第2张

他在研报中提及了行业专家的看法,指出B300的发热问题不仅与DrMos芯片有关,系统级芯片的管理设计亦存在缺陷。由此可见,芯片过热并非由单一原因造成,而是由多个因素共同作用的结果。

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第3张

英伟达架构调整情况

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第4张

英伟达的GPU产品在切换至Blackwell架构后,频繁遭遇延期交付的问题。黄仁勋曾承诺将坚持“每年更新一代”的产品迭代策略。在DrMos方案方面,Hooper架构的芯片原本由MPS负责供应,而Blackwell架构的芯片则开始测试AOS方案,此举可能旨在降低风险。

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第5张

Blackwell采用MCM技术打造,其独特之处在于同一芯片上集成了两个GPU核心。这一设计或许代表了英伟达在架构创新上的尝试,然而,也可能潜藏一定的风险。

B200芯片交付情况

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第6张

目前,尚无企业成功获得B200芯片。据消息,马斯克通过10.8亿美元的订单获得了该芯片的优先供应权。这些芯片将被用于加强xAI的超级计算集群Colossus。此情况表明B200芯片的生产能力可能有限,或存在特定的生产计划。

同时,其他企业未能获得B200芯片,这表明芯片的生产与供应环节可能存在众多待解难题。这些问题可能对B300/GB300芯片的大规模生产产生一定影响。

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第7张

Blackwell芯片性能和成本

英伟达对Blackwell芯片性能的追求过于强烈,导致其几乎仅作为一个实验平台存在。从互联网企业的视角来看,若大规模采用基于Blackwell芯片的服务器,算力中心的建设成本将显著上升。

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第8张

目前,GB200标准的AI服务器价格因带宽配置差异,介于200至300万美元之间。若采用GB300规格并切换至液冷技术,其成本可能翻番。这种成本增加是公司必须权衡的关键因素。

市场对先进GPU需求存疑

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第9张

市场对最先进GPU的需求强度尚不明朗。若需求不够旺盛,即便英伟达成功解决技术难题实现大规模生产,销售业绩也可能不尽如人意。

此外,尽管英伟达的GPU在大模型训练与部署领域发挥了显著作用,然而,Blackwell架构芯片是否能够单独推动公司业绩实现翻倍增长尚存疑问。这一结果将受到英伟达市场布局及战略规划等多重因素的影响。

系列问题的综合影响

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第10张

总体而言,芯片发热、架构调整导致的延期交付、B200芯片的特殊交付要求、Blackwell芯片的成本与性能挑战以及市场需求的波动等多重因素相互交织。这些因素相互牵制,对英伟达B300/GB300芯片的批量生产和市场表现造成了诸多不确定性。若无法有效解决这些问题,英伟达在GPU领域的进展可能会遭遇重大障碍。

英伟达B300/GB300芯片性能飙升,但1400W功耗成服务器散热新挑战  第11张

读者朋友们,您对英伟达能否解决这些问题有何看法?敬请于评论区发表意见。同时,不妨为这篇文章点赞并推广分享。