网站首页 > 科技资讯 > 正文

DeepSeek大模型性能强成本低，为何遭美猜疑?!

admin 科技资讯 2025-02-03 10:18:43 5 0

2月3日，快科技报道指出，DeepSeek大模型在美国AI领域备受瞩目。该模型的表现与OpenAI的O1模型相当，按常理应受到认可。然而，其训练成本显著低于同类产品，这一情况在业界引发了广泛讨论。

DeepSeek模型概况

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第1张

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第2张

DeepSeek的模型在性能方面表现卓越。尽管官方未公开大模型训练硬件的具体规模，但已知的是，仅利用2048颗H800 GPU，便在两个月内成功训练出了参数量高达6710亿的V3大模型。该训练过程总计耗费了280万个GPU小时。这一成果充分展现了其训练的高效性。

Meta的研究成果备受关注，他们仅用54天时间，凭借16381颗H100 GPU，成功训练了参数量达4050亿的Llama 3模型。在此过程中，GPU累计使用时长高达3080万小时。与此同时，DeepSeek在硬件成本上展现出明显优势，其成本仅为Meta的1/11。

成本背后的硬件推测

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第3张

SemiAccurate研究机构发布的数据显示，DeepSeek可能掌握了约六万枚NVIDIA的GPU。具体来看，A100型号有一万枚，H100型号有一万枚，H800型号有一万枚，而H20型号则有三万枚。这些GPU的总价值已超过140亿元人民币。值得注意的是，A100和H100已被列入美国对华出口限制清单，H800也曾受到出口限制，目前只有H20符合出口条件。

美国方面的猜疑

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第4张

欧美多方面人士对DeepSeek涉嫌通过美国出口管控的漏洞非法获取了NVIDIA生产的H100高性能GPU表示质疑，数量可能超过五万块。这种质疑主要基于DeepSeek在硬件资源相对较少的情况下，依然取得了显著的训练成效。

美国政府持续关注高科技领域的流失现象，这一忧虑源自其对技术掌控的坚定立场，同时亦聚焦于卓越成果的获取与硬件成本等关键问题。

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第5张

新加坡数据异常的关联

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第6张

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第7张

NVIDIA的财务报告揭示，自2022年末中国对AI芯片出口实施限制以来，新加坡在该公司收入中所占比例已从原来的9%上升至现在的22%。这一比例的显著增长与DeepSeek事件紧密相连。

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第8张

美国对DeepSeek可能通过新加坡的第三方企业获取受管制出口的NVIDIA人工智能GPU表示担忧，这一事件导致新加坡成为关注的中心。

美国采取的行动

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第9张

美国白宫与联邦调查局等相关机构已对DeepSeek涉嫌非法获取芯片展开调查。部分美国人士提出，有必要提高对新加坡进出口的监管力度，以阻止受限物品流入中国市场，从而降低技术非法传播的风险。

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第10张

调查活动目前仍在进行中。美方尚未掌握足以对DeepSeek定罪的充足证据。

NVIDIA的回应

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第11张

NVIDIA对此进行了回应，强调其始终遵循相关法律法规。据公司披露，在新加坡的贸易行为中，涉及的大多数货物并未被运往中国，而是被转移到了其他地区。

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第12张

NVIDIA指出，其与新加坡的收益计算是以客户的账单地址为依据，而非货物实际送达的地点。因此，这些收益数据不能作为货物已送达中国的证据。

该事件目前正接受调查和广泛讨论，公众对美方所实施的严格措施是否恰当持有不同看法。若您对这一话题有独到的看法，请给予点赞和转发，同时欢迎在评论区发表您的观点。

DeepSeek大模型性能强成本低，为何遭美猜疑?! 第13张

本文由 @admin 于 2025-02-03 发布在智友网络，如有疑问，请联系我们。
本文链接：https://bbs.zhiyoo.com/zhiyoo/221706.html

admin管理员

上一篇

特斯拉Model 3上海滩陷车，救援为何这么难?

下一篇

哪吒之魔童闹海票房超34亿直逼冠军! 光线传媒总裁会加排片吗?

返回顶部 暗黑模式