联想问天WA7785a G3：单机部署671B DeepSeek大模型，吞吐量达6708token/s，AI算力新标杆诞生

2025年3月17日，联想发布了名为联想问天WA7785a G3的新型AMD AI大模型训练服务器。当该服务器部署了671B（满血版）DeepSeek大模型，其吞吐量达到了6708token/s的最高水平。这一成就显著增强了单台服务器的运行效率，展现了联想在AI基础设施技术领域的雄厚实力。

性能新突破

联想问天WA7785a G3：单机部署671B DeepSeek大模型，吞吐量达6708token/s，AI算力新标杆诞生第1张

联想问天WA7785a G3展现了卓越的性能。该设备基于联想万全异构智算平台，运用访存优化、显存优化等前沿技术，对大模型的全流程进行了不断的优化升级。在将DeepSeek 671B大模型部署于单台设备后，实际测试数据表明，其最高吞吐量达到了6708 token/s。这一成就具有深远影响，体现了该服务器对1500人规模企业日常运作的强大支持能力。此外，它还表明自联想问天WA7780 G3推出以来，在独立设备上部署大型模型进行推理的性能有了新的提升。

联想问天WA7785a G3：单机部署671B DeepSeek大模型，吞吐量达6708token/s，AI算力新标杆诞生第2张

联合研发成果

联想问天WA7785a G3：单机部署671B DeepSeek大模型，吞吐量达6708token/s，AI算力新标杆诞生第3张

此次技术发展得益于多团队的共同努力。联想中国的设施部门、联想研究院的ICI实验室及AMD共同参与了设计，对方案进行了细致优化。联想问天WA7785a G3服务器是联想与AMD深度合作的重要成果，双方紧密合作推动了技术创新，促进了软硬件的同步发展，并在架构上取得了显著突破。DeepSeek-R1满血版大模型凭借其卓越成果，实现了显著性能的提升，这一成就有效加速了大模型技术的进步步伐。

强大算力引擎

联想问天WA7785a G3：单机部署671B DeepSeek大模型，吞吐量达6708token/s，AI算力新标杆诞生第4张

该服务器装备了两枚AMD处理器，同时集成八枚AMD最新型号的Instinct OAM GPU。这些配置旨在服务于大规模模型训练和推理任务，展现了出色的计算能力。其显存带宽高达5.3TB/s，GPU聚合带宽为896GB/s，节点间网络带宽更是突破了3.2TB/s。更宽的带宽能够显著提升推理解码的速度，这一特性与大模型并行计算对高带宽通信的依赖相契合，因此成为了用户选择大模型推理服务器的优先配置选项。

独特架构设计

联想问天WA7785a G3：单机部署671B DeepSeek大模型，吞吐量达6708token/s，AI算力新标杆诞生第5张

联想问天WA7785a G3的设计独具匠心，其价值显著。该产品采用三项独立风道技术，对CPU、GPU及交换机节点实施精确散热控制，有效提升了散热性能。这种散热管理策略精准且高效，确保了服务器的稳定和可靠性。在处理持续且复杂的大规模计算任务时，服务器能够维持其性能的稳定性。同时，该机制大幅减少了因温度过高导致的故障概率。

满足企业需求

联想问天WA7785a G3：单机部署671B DeepSeek大模型，吞吐量达6708token/s，AI算力新标杆诞生第6张