就在昨日,OpenAI宣布,发布文生视频大模型:Sora
事件一出,立刻震惊世界。
简单的说,这项新工具,可以根据人们的文字叙述,自动生成视频。
强大到什么程度?看看下面 官方的例子👇

例子一:文字描述了一位女性的末日,视频做出了下面的效果 
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
提示:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。
60s,一镜到底,而且不止主人物稳定,连特么背景里面的人物,都稳定的难以置信。从大中景无缝切换到脸部特写。
 二. 单视频多角度镜头切换: 月圆狼嚎 
不仅如此,在一分钟的镜头里,Open AI还实现了多角度的镜头切换...而且...物体一致...

Prompt: A beautiful silhouette animation shows a wolf howling at the moon, feeling lonely, until it finds its pack.
提示:一个美丽的剪影动画展示了一只狼对着月亮嚎叫,感到孤独,直到它找到狼群。
文字叙述中的孤独,被展示得淋漓尽致。
案例三:理解逻辑和物理规律,做出符合现实的视频
前面的视频case,其实已经能看出Sora,已经能懂物理规律了。
比如这个Case:

Prompt: A cat waking up its sleeping owner demanding breakfast. The owner tries to ignore the cat, but the cat tries new tactics and finally the owner pulls out a secret stash of treats from under the pillow to hold the cat off a little longer.
提示:一只猫叫醒熟睡的主人,要求吃早餐。主人试图忽视这只猫,但猫尝试了新的策略,最后主人从枕头下拿出秘密藏匿的零食,让猫再呆一会儿。
这个视频最离谱的在于...
猫在AI里...有非常强的猫逻辑,完全符合猫的天然属性,不僵硬........这..........养猫的人,都一定深有感触。。。
虽然Open AI的世界模型,还有很多弊端,需要继续精细化...
但是...
 写在最后 
一年的时间,OpenAI炸出来一个王炸。
不少人昨天的感觉是,整个视频行业彻底完蛋了....

不仅仅是AI视频行业...还有传统的影视公司...
比如虚拟拍摄、比如特效、比如广告....
额..... 小伙伴们,你们怎么看呢?
本文部分转载自:数字生命卡兹克
继续阅读
阅读原文