腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第1张

12月3日,快科技报道,腾讯混元大模型发布重大更新,其中文生视频功能正式启用,此消息在科技界引发巨大关注。仅需一句描述,即可生成视频内容,这一创新功能仿佛魔法般神奇,引发了业界的极大兴趣。

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第2张

巨大参数量

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第3张

腾讯推出的开源视频生成大模型混元,参数量达130亿,成为目前最大的视频开源模型。如此庞大的参数量,为模型在视频生成方面奠定了稳固的基础。130亿的参数量表明,模型能处理更为复杂的情况,如同拥有一个超级大脑,能够应对视频生成过程中的各种挑战。这一数据亦反映出腾讯在大模型技术研发方面的投入力度。在业界,高参数量的模型通常具备更强大的功能,这将使腾讯在竞争中处于优势地位。

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第4张

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第5张

免费使用平台发布

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第6张

该模型已分别在HuggingFace平台和Github上发布。其中包含了详尽的内容,包括模型权重、推理代码和算法等,相当于一个宝库,无私地供企业与个人开发者使用。这种开放态度值得肯定,企业和开发者可免费利用这一强大工具,并开发生态插件。此举将促进创新,有望催生众多基于腾讯混元大模型的特色产品。

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第7张

申请试用渠道

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第8张

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第9张

大众群体同样能够享受到这项前沿的文本转视频技术。用户可于腾讯元宝APP的AI应用模块下,通过AI视频选项提交试用申请。针对企业用户,腾讯云提供了更为专业的接入途径,并同步开启了API的内测申请通道。此举为不同用户群体设定了明确的试用路径,便于用户依据个人需求便捷操作。

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第10张

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第11张

多语言及格式支持

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第12张

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第13张

腾讯的混元大模型在视频生成领域,实现了中英文双语的输入功能,体现了其全球化的战略眼光。此外,该模型支持多样化的视频尺寸和清晰度,为用户提供了丰富的选择。用户可根据需求,制作适用于大屏幕的超高清视频,亦或是在小屏幕上观看的低分辨率视频,混元大模型均能胜任。

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第14张

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第15张

超写实高质量视频

腾讯推出的混元视频生成大模型展现出令人瞩目的视频生成能力。该模型能够创造出高度逼真的高质量视频,即便是涉及冲浪、跳舞等复杂动作的场景,也能轻松应对。所生成的画面既自然又合理,且不易出现扭曲。在处理镜面或镜子的场景时,模型能够实现镜面反射动作与外部动作的完全同步,光影反射效果也基本遵循物理规律。这些特点表明,该模型不仅在视频外观上合格,在细节处理上的精准度也堪称上乘。

腾讯混元大模型震撼上线文生视频功能,130亿参数打造超写实视频体验  第16张

独特的技术架构

腾讯混元视频生成大模型基于DiT架构,对架构进行了多方面优化。模型融入了新一代文本编码器,增强了语义理解能力,从而在多主体描绘和细致指令执行方面表现出色。借助先进的图像视频混合VAE(3D变分编码器),模型在细节描绘上显著进步,尤其在小人脸和高速镜头等复杂场景中效果更佳。令人好奇的是,腾讯混元大模型的文生视频功能将如何深刻影响视频制作领域?欢迎点赞、分享,并参与评论区讨论。