2025年3月17日,联想发布了名为联想问天WA7785a G3的新型AMD AI大模型训练服务器。当该服务器部署了671B(满血版)DeepSeek大模型,其吞吐量达到了6708token/s的最高水平。这一成就显著增强了单台服务器的运行效率,展现了联想在AI基础设施技术领域的雄厚实力。

性能新突破

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第1张

联想问天WA7785a G3展现了卓越的性能。该设备基于联想万全异构智算平台,运用访存优化、显存优化等前沿技术,对大模型的全流程进行了不断的优化升级。在将DeepSeek 671B大模型部署于单台设备后,实际测试数据表明,其最高吞吐量达到了6708 token/s。这一成就具有深远影响,体现了该服务器对1500人规模企业日常运作的强大支持能力。此外,它还表明自联想问天WA7780 G3推出以来,在独立设备上部署大型模型进行推理的性能有了新的提升。

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第2张

联合研发成果

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第3张

此次技术发展得益于多团队的共同努力。联想中国的设施部门、联想研究院的ICI实验室及AMD共同参与了设计,对方案进行了细致优化。联想问天WA7785a G3服务器是联想与AMD深度合作的重要成果,双方紧密合作推动了技术创新,促进了软硬件的同步发展,并在架构上取得了显著突破。DeepSeek-R1满血版大模型凭借其卓越成果,实现了显著性能的提升,这一成就有效加速了大模型技术的进步步伐。

强大算力引擎

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第4张

该服务器装备了两枚AMD处理器,同时集成八枚AMD最新型号的Instinct OAM GPU。这些配置旨在服务于大规模模型训练和推理任务,展现了出色的计算能力。其显存带宽高达5.3TB/s,GPU聚合带宽为896GB/s,节点间网络带宽更是突破了3.2TB/s。更宽的带宽能够显著提升推理解码的速度,这一特性与大模型并行计算对高带宽通信的依赖相契合,因此成为了用户选择大模型推理服务器的优先配置选项。

独特架构设计

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第5张

联想问天WA7785a G3的设计独具匠心,其价值显著。该产品采用三项独立风道技术,对CPU、GPU及交换机节点实施精确散热控制,有效提升了散热性能。这种散热管理策略精准且高效,确保了服务器的稳定和可靠性。在处理持续且复杂的大规模计算任务时,服务器能够维持其性能的稳定性。同时,该机制大幅减少了因温度过高导致的故障概率。

满足企业需求

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第6张

联想问天WA7785a G3服务器对于1500人规模企业的日常运作至关重要。随着数字化进程的加快,企业对计算能力的依赖持续增强。此服务器以其卓越性能,确保了企业办公、生产和研发等各方面需求得到充分满足,显著提升了工作效率,进而促进了企业业务的增长。

未来发展方向

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第7张

联想公布将与行业伙伴加强技术沟通。公司计划加强架构创新、算法改进及硬件技术的革新,致力于性能的持续进步。该策略旨在为各领域提供更密集、能耗更低、部署更便捷的AI算力基础设施。这一行动预计将促进AI算力向更高效率、更普及和更持续的发展趋势转变,进而推动我国智能计算产业的持续发展。

联想问天WA7785a G3:单机部署671B DeepSeek大模型,吞吐量达6708token/s,AI算力新标杆诞生  第8张

请问您如何看待联想问天WA7785a G3服务器在性能上的最新发展?这一成就可能对AI算力领域带来哪些变化?欢迎您在评论区分享您的看法。同时,请不要忘记点赞和转发本篇文章。