AI算力需求爆发
近期,英伟达首席执行官黄仁勋在财报公布后强调,目前AI模型所需的计算能力是之前的百倍。这一增长主要得益于AI推理需求的提升。同时,DeepSeek通过算法革新,重新定义了AI计算能力的发展路径,促使AI计算模式从以“训练”为主转向以“推理”为主,从而引发了AI推理需求的激增。
模型架构优势凸显
专家模型被部署在多个GPU上,每个GPU负责处理少数专家模型,此举减少了数据访问的需求,进而缩短了处理时间。“大量小专家”的架构设计进一步减少了每次推理所需的参数数量,这种低成本的解决方案使得模型在AI推理领域得到更广泛的应用。
推理Scaling Law作用显著
推理的Scaling Law主要依赖于扩充计算资源,包括延长推理时间、增强算力等手段,以增强模型的表现力。以o1型推理模型为例,它在推理过程中融入了多阶段思维链和强化学习技术,显著提高了推理效能,从而带动了对推理计算资源的巨大需求增长。
DeepSeek成开源替代方案
DeepSeek为整个行业带来了卓越性能的开源替代方案,迅速扭转了行业态势。大众用户可免费获取并利用,各类企业,无论大小,都能将DeepSeek的系列模型融入其业务流程。特别是在面向企业的服务领域,DeepSeek提供的优质开源模型有效缓解了企业对数据维度的担忧。同时,DeepSeek目前不倾向于商业化,其更贴近于纯正的开源精神。
行业竞争点转变
姚欣指出,DeepSeek推出的跨节点并行专家系统展现了分布式理念,将不常使用的专家模型汇集,而将常用模型分配更多计算资源。鉴于其集中式集群特性,云服务提供商的优化空间相对有限。未来竞争的焦点将集中在从不同显卡类型到模型层的全面优化上。
不同玩家各显神通
AI基础设施和云服务提供商在技术基础和成本控制方面占据有利位置,然而并非所有AI企业都具备处理高流量互联网服务的丰富经验。例如,PPIO派欧云利用分布式网络技术提供算力服务,覆盖全国算力节点,向企业客户供应更具弹性和稳定性的AI推理服务。目前,该公司的算力云产品已为百川智能等众多企业提供服务。
未来AI推理市场的走向及企业间的竞争态势备受关注。请问您预测,哪种模式将在AI推理领域占据领先地位?