国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了

12月26日，我国发布了自主研发的DeepSeek大规模语言模型的新版——DeepSeek - V3。该模型新增了多个创新特性，引起了业界的广泛关注，并在大模型领域吸引了众多研究者的注意。

高效的训练时长

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第1张

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第2张

DeepSeek - V3的训练效率显著。DeepSeek发布的报告显示，其训练耗时仅为2.788M H800 GPU小时。而Llama 3系列模型则需要3930万H100 GPU小时。换言之，DeepSeek - V3的训练频率可达到十五次。这一数据突显了DeepSeek - V3在资源利用上的优势。这种高效性对模型的快速迭代至关重要，它有助于缩短研发周期，并降低硬件成本。

从行业视角来看，高效的训练方法能够促进大型模型的研发速度。这种速度的提升，进而会促进整个行业的进步与发展。

强大的性能表现

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第3张

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第4张

DeepSeek - V3已通过多轮性能测试。在与DeepSeek - V2.5、Qwen2.5 - 72B - Inst、Llama - 3.1 - 405B - Inst、GPT - 4o - 0513以及Claude - 3.5 - Sonnet - 1022等模型的比较中，DeepSeek - V3在多个性能指标上表现出色。在14.8万亿高质量token的预训练阶段，DeepSeek - V3通过监督微调和强化学习，充分发挥了其潜力。测试结果表明，DeepSeek - V3在技术层面具有强大竞争力，并能在实际应用中提供更精确的输出。

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第5张

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第6张

开发者可享受更坚实的科技支持，从而助力他们打造更具吸引力的用户界面。

多元语言基础

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第7张

DeepSeek - V3的基础模型已针对包括英语和中文在内的多种语言语料库进行了预训练。基于此，其性能评价主要参照以英语和中文为主的测试基准，并兼顾了其他多语言测试基准。这一多语言能力赋予模型在全球范围内广泛的应用前景，有效应对了不同语言环境下的多元化需求。

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第8张

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第9张

在全球化的趋势下，众多跨国公司和国际业务运营普遍需要依赖多语言服务。DeepSeek - V3系统正具备这种服务功能。

各界高度评价

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第10张

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第11张

田渊栋，Meta AI的研究科学家，在X平台上对DeepSeek - V3的表现感到惊讶。VC Deedy，曾参与Glean和Google Search的创立，对其给予了高度评价。DeepSeek - V3被誉为“全球最佳开源大型模型”。这一专业认可彰显了DeepSeek - V3在技术领域的显著影响力。

X平台用户广泛分享使用感受，普遍认为该产品展现出智能特点，并对DeepSeek团队表达了深切敬意。这一现象表明，DeepSeek - V3在用户群体中获得了较高的认可和正面评价。

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第12张

展示实力历程

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第13张

DeepSeek凭借其开源大模型DeepSeek Coder等作品，在人工智能技术领域展现了其实力。其最新推出的DeepSeek V2模型，凭借其高性价比的创新，推动了国内大模型市场的价格竞争。该模型的MLA架构和DeepSeekMoESparse结构在业界受到了广泛关注。此前，DeepSeek在硅谷被誉为“东方的神秘力量”，而V2模型的论文也被认为是一篇佳作。这些成就为DeepSeek - V3的问世打下了坚实的基础。

国产大模型DeepSeek-V3横空出世，仅需2.788M GPU小时，AI圈惊呼：圣诞节真的来了第14张