视频生成产品Vidu全球上线,4s视频仅需30s时间,业界最快
7月30日,生数科技的视频天生年夜模子 Vidu 面向环球正式上线。
Vidu 是 海内首个纯自研视频年夜模子。4 月尾首 次表态以来,Vidu 凭借媲美 Sora 的视频天生后果,敏捷在海内外引起普遍存眷。
这次 Vidu 开放了文生视频、图生视频两年夜焦点功效,可以天生 4s 或 8s 的视频。视频分辩率最高达 1080P,4s 视频天生实测用时 30s。今朝 Vidu 无需申请,用户注册后即可上手体验。

文章内容来自生数科技官方稿件,Founder Park 有所增删。
01新增动漫作风、脚色同等性更稳固
本次上线版本中新增了脚色同等性、动漫作风等特点才能。
万物皆可二次元
在作风维度上,今朝市道市情上的 AI 视频对象年夜多局限于写实作风或源于实际的想象。Vidu 除了能实现常见的写实等多元作风外,还新增动漫作风。
在图生视频功效中,一些对象只管也支撑动漫图的上传,但经常呈现画面崩坏、动幅小的问题。Vidu 的天生后果具备作风同等性,画面流利。
原图
Vidu 后果
脚色同等性
Vidu 还有一项功效——脚色同等性(Charactor To Video)。
在「图生视频」板块中上传图片,Vidu 支撑首帧图和脚色图两种选择。首帧图便是常见的图生视频功效,会实现基于首帧画面的持续天生。
后者则是脚色同等性天生,用户可上传人像图或者自界说的脚色图,之后经由过程笔墨描写,指定该脚色的场景和动作等。
好比上传一张埃隆-马斯克的照片,经由过程输入描写词,就可以变身超等豪杰钢铁侠。
脚色图
Prompt:Elon Musk wearing Iron Man armor, with a city night scene in the background
用户使用脚色同等或图生视频功效,可以玩转「梗图」、「脸色包」,乃至助力妄想实现。
实测案例:原 图(作为脚色参考图)
Prompt:一个帅哥在变身成为奥特曼,画出正在变身的进程, 从一个通俗人,酿成完备的奥特曼
(作为人像图参考)
02语意懂得更精确,官方声称天生速率业界最快语义懂得
Vidu 可以或许懂得提醒词中的字母、数字等,而且可以或许天生笔墨殊效。
prompt:一块诞辰蛋糕,上面插着烛炬,烛炬是数字「32」的外形
另外,Vidu 可以或许懂得和表达第一人称、延时拍照等镜头语言,视频可控性进步。
Prompt:Capture the journey of a single rose bud as it blossoms into full bloom against a plain, black background. The time-lapse photography isolates the rose, emphasizing its delicate transitions from tight bud to an open, vibrant flower.
动态同等
在涉及繁杂场景的视频中,Vidu 可以或许将活动主体与场景做较好分别,将前后景别分别开。画面中非重点物体的动态较少,画面主体动态完备,画面的真实感更强。
年夜幅度、精准的动作有助于更好地表示情节和人物情绪,然则动作幅度一旦变年夜,画面目面貌易崩坏。一些视频模子为保证流利性会牺牲动幅 。
相比之下,在一些主体动作幅度较年夜的场景中,Vidu 的动态画面流利。
画面质感
Vidu 能天生作风片断,好比科幻、西部和浪漫等类型片子。在构图、叙事、光影等方面,AI 能到达十分靠近片子级的画面尺度。
另外,经典影片中极具标记性的视觉后果,Vidu 都能仿照和再现。
《银翼杀手》中的赛博朋克气氛的将来城市夜景
Vidu 可以或许天生影视级殊效画面,如漫溢的烟雾、炫目标炫光后果、爆炸排场等。
「在传统的影视制造中,殊效的投入每每是一个伟大的数字,像一样平常爆炸殊效镜头通常必要花几十万」,海内某资深殊效总监说。用过 Vidu 后,他表现 Vidu 天生的爆炸天生后果已经异常靠近影视制造的水准,这很令人受惊。
天生速率业界最快
AI 视频对象还有个紧张指标——推理速率。
今朝,市道市情上的主流 AI 视频对象在天生 4 秒左右的视频片断时,用户通常必要期待 1 到 5 分钟,乃至更长。例如,Runway 最新推出的 Gen-3 对象必要 1 分钟来完成 5s 视频天生,而可灵必要 2-3 分钟。Vidu 将这一期待光阴缩短至仅需 30 秒(可真实实测),速率比业内最快程度的 Gen-3 还要再快一倍。
Vidu 此次的更新版本带来了更丰硕顺滑的创作体验,在视频天生范畴,用户又多了一个选择。将来的视频模子竞争,只会越来越卷。
转载原创文章请添加微信:founderparker