腾讯混元大模型上线文生视频,一句话生成视频教程来啦!

   时间:2024-12-05 09:30 来源:ITBEAR作者:任飞扬

腾讯近日在AI技术领域迈出了重要一步,其混元大模型宣布正式上线了一项创新功能——文生视频。这一功能允许用户仅凭一句话的描述,就能自动生成相应的视频内容。

据悉,腾讯此次开源的视频生成大模型拥有惊人的130亿参数量,是目前市场上最大的视频开源模型。这一技术的推出,无疑为视频创作领域带来了全新的变革。

用户在使用该功能时,只需输入一段简短的描述文字,系统即可根据输入内容生成视频。更令人惊喜的是,该功能支持中英文双语输入,且提供了多种视频尺寸和清晰度选项,满足用户的不同需求。

目前,腾讯已将这一创新功能集成到了其元宝APP中。用户只需通过AI应用中的“AI视频”板块,即可申请试用该功能。同时,企业客户也可以通过腾讯云提供的服务接入该功能,目前API内测申请也已同步开放。

在实际应用中,腾讯混元视频生成模型展现出了卓越的性能。在与国内外多个顶尖模型的评测对比中,该模型在文本视频一致性、运动质量和画面质量等多个维度上均取得了领先地位。特别是在人物、人造场所等复杂场景下,其表现尤为出色。

该模型生成的视频不仅画质超写实,而且能够高度符合用户的提示词。画面流畅自然,不易出现变形现象。腾讯混元在处理大幅度运动画面时,也展现出了卓越的能力。

例如,在冲浪、跳舞等场景中,该模型能够生成非常流畅且合理的运动镜头。物体在画面中的运动轨迹自然,不易出现变形现象。同时,光影反射效果也基本符合物理规律,在镜面或照镜子等场景中,能够实现镜面内外动作的一致性。

更为先进的是,腾讯混元视频生成模型还具备自动切换镜头的能力。在保持画面主角不变的情况下,该模型能够自动切换镜头,为观众带来更加丰富的视觉体验。这一功能在业界中尚属罕见。

 
 
更多>同类内容
全站最新
热门内容