我国大模型创业市场呈现鲜明对比,一方面,算力提供商、模型服务提供商及开源项目受益者等积极融入DeepSeek生态系统,展现出强劲的发展势头;另一方面,其他“大模型六小虎”创业公司及其背后的风险投资机构正遭遇诸多挑战。
大模型创业热潮的升温导致各阵营间发展差异日益凸显。这种差异不仅对行业内企业的发展造成影响,同时也对整个大模型行业的整体格局产生了显著作用。
在过去两年中,一些投资于估值位于行业领先地位的大模型企业的风险投资团队,正面临内部压力。他们遭到了质疑,为何所投企业未能效仿DeepSeek等成功案例。自2023年起,大模型初创企业数量增加,众多风险投资团队纷纷加入投资行列。
部分项目进展未达既定目标,导致风险投资团队遭受质疑。在模型领域迅猛发展的背景下,投资决策的准确性遭遇重大挑战。在充满不确定性的环境中,VC 需要迅速识别并锁定具有发展潜力的项目,这已成为他们迫切需要解决的难题。
自2023年起,大模型领域的创业公司数量激增至十余家。Llama开源项目在技术层面起到了关键作用,而其根本动因在于业界普遍看好大模型的发展前景。随着GPT的走红,这一共识进一步催生了我国大模型创业的热潮。
众多创业者和资本涌入该领域,意图分得一部分市场份额。但在这股热潮之下,也暴露出一些问题。部分企业因缺乏核心竞争优势,使得行业发展呈现出不正常的状态。
MiniMax凭借Glow产品脱颖而出,并非依赖其底层大模型技术赢得了资本的关注,这种情况颇为罕见。同时,接近闫俊杰的人士对其评价为“对技术充满追求”,这也为MiniMax的未来发展注入了新的期待。
百川公司因未投入训练大型视频模型,其研发成本相对较低,且资金流动情况良好。然而,这一优势仅限于百川自身,对整个行业的发展推动作用有限。这种现象揭示了各公司在发展战略上的明显分歧。
在过去两年间,大模型技术迅猛发展,若一位风险投资家对技术学习持消极态度,其带来的负面影响可能超过对技术研发者的影响。这主要是因为风险投资家的投资决策对众多初创企业的发展轨迹具有决定性作用。
中国早期风险投资对大型模型企业商业化的耐心显著减少,从原本的5至8年缩短至3年以内。这种急于求成的心理可能使一些具有发展潜力的项目被忽视,进而提升了投资风险,并加剧了行业的不确定性。
梁文锋在DeepSeek公司早期便致力于研究如何以低成本提升模型性能,这一做法当时并未被行业广泛理解。然而,随着R1的发布,有经验丰富的强化学习专家提出,采用纯强化学习算法替代传统的RL+SFT模式,有望在三年内实现通用人工智能。
DeepSeek的举措使人们认识到,AGI技术尚未触及顶峰,我国科技队伍具备领导全球AGI创新的潜力。这一发现为我国大模型产业注入了新的活力,指明了未来的希望与路径。
关于未来中国大模型行业,您认为哪一方更有机会崭露头角?欢迎在评论区发表您的观点,并对本文进行点赞和转发。