近期报道指出,昇腾910C虽非最顶尖的AI芯片,却对减少我国对NVIDIA GPU的依赖贡献显著,这一现象受到了广泛关注。
昇腾910C的意义
昇腾910C的性能虽非顶尖,但在我国推进国产化进程中扮演着重要角色。众多国内产业对国外GPU的依赖程度较高,昇腾910C的问世为摆脱这种依赖提供了可能性。据2023年数据,我国AI芯片需求持续上升,其中进口GPU占据较大比例。昇腾910C的问世为扭转这一状况提供了新途径。它可应用于众多具体业务场景,对国内AI产业的发展至关重要。
DeepSeek的原生支持
DeepSeek对昇腾处理器及PyTorch库提供了原生支持,这一支持不容小觑。它能在极低的资源消耗下,实现CUDA到CANN的无缝过渡。从当前技术角度看,这种转换能力极为罕见。过往的测试数据显示,传统转换过程往往需耗费大量人力、物力和时间。DeepSeek的原生支持简化了华为硬件融入AI工作流程的过程。例如,许多小型AI研发企业曾因转换难题而倍感压力,这一支持显著减轻了他们的负担。
CANN平台的关键作用
昇腾的CANN架构专为AI应用设计,其详细内容可在华为官方页面找到。CANN在昇腾体系中扮演着至关重要的角色,连接着上层框架和底层处理器。它兼容多种AI框架,确保了广泛的协作可能。此外,CANN服务于AI处理器和编程,覆盖了昇腾处理器的主要计算环节。根据实际业务数据,CANN的使用显著提升了昇腾处理器的计算效率。在众多AI应用场景中,CANN的高效接口显著缩短了应用和业务构建的时间。
DeepSeek的大语言模型准备
DeepSeek研发的大规模语言模型展现出独特的发展路径。据悉,该模型跳过了英伟达的CUDA架构,此举可能旨在适配国内生产的GPU芯片。目前,我国在AI芯片领域迫切需要此类创新措施。以昇腾为首的国产芯片生态建设亟需此类软件层面的支撑。目前,我国国产GPU芯片的研发步伐持续加快,若能在软件层面提前布局适配策略,将对国产硬件与软件的协同进步产生积极影响。
CUDA与PTX的比较
CUDA与PTX在编程领域扮演着不同的功能。CUDA以其高级性和易用性受到开发者的青睐,在常规开发中广泛采用。根据开发数据统计,CUDA在AI领域的应用比例显著。它使开发者能够集中精力于程序的核心运行逻辑。相比之下,PTX位于更接近汇编语言的底层,具备细粒度优化能力,如寄存器分配等。然而,这种编程方式复杂且维护难度大。北京某AI开发企业内部测试表明,使用CUDA进行开发,其效率远超PTX。
绕过CUDA对适配国产硬件的好处
绕过CUDA对于未来适配国内GPU硬件具有显著优势。正如北京航空航天大学黄雷副教授所言,开发者可以直接基于GPU驱动函数进行开发,实现精细化的操作。比如,在DeepSeek采用国内GPU时,将能便捷地利用硬件提供的函数接口,参照英伟达的编程接口编写代码。这对大型模型在国产硬件上的适配速度和质量均具有正面影响。若国内硬件能实现如此高效适配,将极大地促进国内AI产业链的进步。
您如何看待昇腾910C在我国AI芯片领域的未来发展?敬请于评论区发表见解。同时,欢迎点赞并转发本篇文章。