每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第1张

焦点关键词在GTC这场盛大的会议上,创始人“老黄”多次强调了“tokens”、“推理”以及“Agentic AI”等概念,这些词汇迅速吸引了全场的关注。这些关键词究竟蕴含着怎样的技术潜能,以至于能吸引众多目光,后续的众多成果或许为我们提供了一些线索。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第2张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第3张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第4张

超级计算机登场Project Digits项目,自今年1月在CES上亮相以来,已正式命名。这款超级计算机是全球最小的个人AI设备,搭载英伟达GB10芯片,具备每秒1000亿次的AI运算能力,适用于调整和推理最新的AI模型。它主要服务于研究人员、数据科学家、AI开发者以及学生,为他们提供强大的计算资源。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第5张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第6张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第7张

性能纪录突破B200目前保持着记录,然而,英伟达已明确指出,随着Blackwell Ultra等新型GPU的问世,这一记录将被刷新。这一声明凸显了英伟达在GPU技术领域的持续创新实力。同时,这也预示着未来AI计算性能将显著提高,为处理更复杂的AI任务提供更强大的支持。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第8张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第9张

新网络交换平台英伟达最新推出的网络交换平台,由Spectrum - 4以太网交换机和BlueField - 3 SuperNIC联合构建。该平台显著提高了端口数据传输速率至1.6Tb/s,整体传输速度高达400Tb/s。这一提升使得数百万个GPU能够实现无障碍协作。此举显著提升了AI、机器学习以及自然语言处理等领域的性能。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第10张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第11张

推理服务库发布NVIDIA Dyamo的发布备受瞩目,被老黄誉为“AI工厂的操作系统”。该系统的核心宗旨是提升推理性能,同时减少Test-Time算力消耗。在NVIDIA Blackwell平台上,通过Dynamo进行优化,DeepSeek-R1的吞吐量可提高至30倍。目前Dynamo已完全开源,支持多类软件框架。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第12张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第13张

新推理模型开源英伟达发布了一款新的AI推理模型,名为Llama Nemotron。该模型在今年的CES展会上已有亮相。此举旨在促进AI推理技术的交流与提升,有助于加快行业发展速度,并为开发者提供更多选择和便利。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第14张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第15张

自动驾驶新系统英伟达推出端到端自动驾驶汽车安全系统NVIDIA Halos。该系统在计算方面依托三种高性能平台,实现从AI训练到部署的全过程支持。这一系统为自动驾驶的安全与进步提供了全方位的解决方案,预计将加速自动驾驶技术的市场应用。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第16张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第17张

合作与新模型推出在会议尾声,老黄公布,英伟达将与Google DeepMind及Disney Research携手共建新一代开源的物理仿真模型Newton。此外,Isaac GR00T N1也同步亮相,被誉为全球首个开源、可全面定制的类人机器人基础模型,为人形机器人的研究与发展开辟了新的篇章。

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第18张

GTC大会即将举行,英伟达展示了多项引人注目的技术突破和新产品。这些创新涵盖了从个人超级计算机到网络交换平台,从推理服务库到自动驾驶系统等多个领域。这些成果预计将在人工智能的未来发展中扮演关键角色。针对英伟达的这些创新,你认为哪项技术最有可能引领未来科技的发展趋势?

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第19张

每秒处理250个token!英伟达DeepSeek-R1推理性能创世界纪录,未来GPU将以Feynman命名  第20张