全球最强开源视频生成模型问世，你想体验吗？

合作开源宣布

2月18日，阶跃星辰与吉利汽车集团共同对外发布，双方合作开发的阶跃Step系列多模态大型模型已向全球开发者开放源代码。这一动态迅速在科技界引发广泛关注。自即日起，开发者们可通过跃问APP亲身体验这两款创新性模型。此次开源举措，预计将对全球科技行业的发展产生深远影响。

全球最强开源视频生成模型问世，你想体验吗？第1张

此次联合开源项目标志着两大实力派企业的深度合作。阶跃星辰在大型模型研发领域积累了丰富的技术经验，吉利汽车集团在业界享有显著声誉。双方合作共享研发成果，预计将促进整个行业的共同发展，增强全球开发者的创新潜能。

全球最强开源视频生成模型问世，你想体验吗？第2张

模型介绍

全球最强开源视频生成模型问世，你想体验吗？第3张

T2V模型在全球范围内被认为是参数量最多、性能最佳的开放源代码视频生成工具。该模型在复杂动作、美观人物塑造和视觉创意等方面展现了卓越的生成能力。同时，它在原生中英双语输入及镜头语言处理方面同样表现出色，能够满足各类开发者多样化的需求。

Step - Audio 是业界首个达到产品级别、开源的语音交互大型模型。该模型在理解中文语义和执行指令方面表现出色，堪称行业翘楚。因此，在与用户互动时，它能更准确地把握用户意图，并给出更贴合用户需求的反馈。

视频模型评测

全球最强开源视频生成模型问世，你想体验吗？第4张

全球最强开源视频生成模型问世，你想体验吗？第5张

阶跃星辰公司为衡量文生视频的品质，推出了一个名为Step - Video - T2V - Eval的开源基准数据集。该数据集汇集了128个来自实际用户的中文评价问题。这些问题能够对视频在运动、风景、动物等11个不同内容类别中的质量进行详尽的评估。

全球最强开源视频生成模型问世，你想体验吗？第6张

评测结果显示，Step-Video-T2V模型在多个关键性能指标上，如指令执行和运动流畅度，均显著优于市场上表现最出色的开源视频模型。这一发现揭示了该模型在视频生成技术领域的领先地位，并为未来的视频制作提供了更为有力的支持工具。

语音模型优势

全球最强开源视频生成模型问世，你想体验吗？第7张

阶跃Step-Audio系统可根据场景需求，提供多样化的语音表达，涵盖情感、地方口音、语言种类、歌声以及个性化特色。该系统生成的语音具备超凡的自然度和高情商，同时能精确复刻音色并胜任角色扮演任务。

全球最强开源视频生成模型问世，你想体验吗？第8张

全球最强开源视频生成模型问世，你想体验吗？第9张

在五大主流公开测试中，Step-Audio模型的成绩超越了业界同类开源模型，位居首位。特别是在HSK-6评测中，其表现尤为出色，这一成绩充分体现了其对中文理解的精确性与深度，使其当之无愧地成为最擅长理解中国语言的开放源代码语音交互大型模型。

评估体系发布

全球最强开源视频生成模型问世，你想体验吗？第10张

阶跃星辰开发了名为StepEval的音频360基准测试，这是一套多维度评估体系。它从角色扮演、逻辑推理等九个基础能力方面，对开源语音模型进行了全面评估。该评估体系的开放，为行业内部评估语音交互大型模型引入了新的评价准则与手段。

人工评估数据表明，Step-Audio模型在各个性能指标上均表现优异，其综合能力超越了市场上已知的最优开源语音模型。这一结果进一步印证了该模型的高性能，同时也为其他模型的研发与评价过程提供了有价值的参考依据。

行业认可

全球最强开源视频生成模型问世，你想体验吗？第11张

Clement Delangue，Hugging Face的联合创始人兼CEO，对阶跃星辰的大模型给予了高度评价。他认为，这一模型有望成为下一个DeepSeek。这一评价体现了国际科技界对阶跃星辰研发成果的认可，同时也激发了人们对这两款开源大模型未来的期待。

全球最强开源视频生成模型问世，你想体验吗？第12张

全球最强开源视频生成模型问世，你想体验吗？第13张

这次阶跃星辰与吉利汽车的携手合作，开启了开源新篇章。该合作不仅向全球开发者输送了高效工具，还为科技领域的进步注入了新的活力。展望未来，这两款大型模型在更多领域的应用潜力，值得我们持续观察和期待。

全球最强开源视频生成模型问世，你想体验吗？第14张

阶跃星辰推出的两款开源大型模型预计将在哪些特定领域引发显著变革？欢迎在评论区发表您的看法。同时，请不要忘记为本文点赞并转发，以示支持！