近期,有关NVIDIA在研发新一代AI服务器产品GB300和B300的过程中遭遇困难的报道传来。这一动态已成为科技界关注的焦点。

郭明錤报告指出问题

NVIDIA下一代AI服务器遇重大挑战:5x5 DrMOS芯片过热问题或将影响量产进度  第1张

分析师郭明錤的最新投资报告揭示,NVIDIA正在对GB300和B300进行DrMOS技术的测试开发。报告发布于12月17日,郭明錤的分析报告历来备受行业关注。测试期间,出现了元件过热的现象。这一问题是服务器开发中的关键挑战。若不解决过热问题,将引发性能下降等一系列问题。

过热元件具体情况

NVIDIA下一代AI服务器遇重大挑战:5x5 DrMOS芯片过热问题或将影响量产进度  第2张

AOS公司生产的5x5DrMOS芯片存在明显的过热问题。这一过热问题不容忽视。它可能对GB300和B300系统的量产进程造成影响,并对整体生产计划构成冲击。同时,这也可能调整市场对AOS订单的预期,导致众多依赖AOS产品的企业重新评估其合作关系。

NVIDIA测试目的

NVIDIA下一代AI服务器遇重大挑战:5x5 DrMOS芯片过热问题或将影响量产进度  第3张

NVIDIA对AOS的5x5DrMOS进行优先测试,目的明确。其一是为了提升与MPS公司的谈判筹码,这在商业竞争中是一项关键策略。其二是为了削减成本,在产品开发阶段成本管理至关重要。此外,AOS在5x5DrMOS的设计与生产方面拥有丰富经验,这也是NVIDIA作出选择的重要因素。

过热问题成因复杂

NVIDIA下一代AI服务器遇重大挑战:5x5 DrMOS芯片过热问题或将影响量产进度  第4张

供应链信息显示,AOS的5x5DrMOS过热现象并非单一原因。此问题不仅与芯片自身有关,还与系统芯片管理及设计上的缺陷有关。由此可见,解决此问题需从芯片以外,对系统管理等多个层面进行优化和提升。

可能的解决方案

NVIDIA下一代AI服务器遇重大挑战:5x5 DrMOS芯片过热问题或将影响量产进度  第5张

若AOS未能在既定时限内处理过热状况,NVIDIA将采取两种应对措施。首先,他们可能寻求新的5x5DrMOS供应商,以确保测试活动不受影响。其次,他们可能转而采用5x6DrMOS,尽管这会提升成本,但散热效果更优,这对于在5x6设计方面拥有技术优势的MPS公司来说更为有利。

GB300的散热创新

NVIDIA下一代AI服务器遇重大挑战:5x5 DrMOS芯片过热问题或将影响量产进度  第6张

NVIDIA下一代AI服务器遇重大挑战:5x5 DrMOS芯片过热问题或将影响量产进度  第7张

尽管当前面临成长的障碍,NVIDIA仍计划于2025年中期发布新一代AI服务器“BlackwellUltra”GB300。该服务器在散热技术上实现了革命性的突破,采用了前所未有的全水冷设计。这一创新旨在突破AI算力的限制,但在此之前,必须先解决先前提到的元件过热问题。各位读者,对于NVIDIA能否成功解决DrMOS技术中的过热问题,您有何看法?欢迎点赞、分享并积极留言讨论。