作为视觉特效设计师,陆地是幸运的。在 2011 年加入英国视效工作室双重否定(Double Negative)后,他参与的第一个项目,就是克里斯托弗·诺兰导演的《蝙蝠侠:黑暗骑士崛起》。后来凭借《星际穿越》和《奇幻森林》,他作为团队成员又两次获得奥斯卡金像奖最佳视觉效果奖。
视效是一个技术与艺术高度结合的行业。视效设计师帮助导演把他们脑海里构建的世界搬到荧幕上。上世纪 70 年代,乔治·卢卡斯开拍《星球大战》,为了保证电影的视觉效果,他创立了视效公司工业光魔,这被普遍视为电影视效行业的开端,后者也一直走在技术前沿,创造出众多经典的影视场景。
不过当技术发展到一定程度,盲目追求视效有时也侵蚀了电影的艺术性。而当 AI 浪潮袭来,从文生文、文生图、文生音,再到文生视频的快速迭代,又仿佛让视效乃至整个影视行业都有了被颠覆的可能。
陆地如今在大学教授一些视效课程,也从事自己的创作。在他的眼里,AI 带来的影响力远不局限于行业内部;而说回电影本身,AI 当下的冲击反而没有那么大。
以下是他的讲述。
严格意义上说,刚有电影,就有视效了。1902 年乔治·梅里爱执导并主演的电影《月球旅行记》里有一个经典场景——一发炮弹打到月亮脸上。这个画面的制作,是先把月亮加到人脸上,再把炮弹加到月亮上。其实就是合成的概念,现在视效里依然很常用,只不过做得更精细了。
▲ 《月球旅行记》剧照。| 图源:豆瓣
视效的主要工作,就是设计制作场景和角色,以及爆炸、流体等特效。视效要达到的目的,一直以来都是「乱真」,只是不同时期使用的技术和手段不一样罢了。
CG(computer graphics,电脑图像)的大规模使用,是从上世纪 90 年代的《终结者 2》(1991年)和《侏罗纪公园》(1993 年)开始的,以往传统拍摄手法表现不出的故事得以登上银幕。21 世纪初期,视效技术初步成型。随着《本杰明·巴顿奇事》(2008 年)和《守望者》(2009 年)上映,可以「乱真」的数字人出现了。
视效中,技术难度最高的就是人,我们行业内叫数字替身(digital double)。做其他东西,差不多都可以应付,唯独人,必须做得特别细,才能乱真,否则就会出现「恐怖谷效应」(人形玩具或机器人的仿真度越高人们越有好感,但在相似度达到百分之八九十时,那种既像真人,又缺少生命力的形象会让人感觉惊悚)。制作高速运动的数字替身,难度会相对低一点,因为高速运动带来的动态模糊,可以隐藏很多不够真实的部分;反而是坐在那里不动,或静静说话的数字替身,最不容易让观众全然接受。
一个典型的例子是绿巨人浩克。绿巨人的视效制作在商业电影里算挑战比较高的。2008 年漫威电影《无敌浩克》里的绿巨人就不太真实。随着漫威宇宙展开,以及工业光魔技术上的突破,2018 年和 2019 年《复仇者联盟》第三部和第四部上映时,绿巨人的眼睛、皮肤等细节就做得非常好了,它也可以像正常人一样说话,甚至操纵机器,比较自然地塑造了「聪明的浩克」。
▲ 《无敌浩克》剧照。| 图源:豆瓣
▲ 《复仇者联盟4》剧照。| 图源:豆瓣
当时工业光魔已经运用了一些 AI 技术。除了利用动作捕捉技术捕捉绿巨人扮演者马克·鲁弗洛的动作,以及手 K 动画(借助三维设计软件通过关键帧技术实现动画效果),还用 AI 解算出鲁弗洛脸部的细小动作,再转成动画数据。三者加在一起,才使浩克的脸部动画自然、真实。
我参与制作的比较重要的数字人,是《雷神2》里的洛基。由于数字人要能替换真人,可发挥空间很小,只能严格按照演员拍摄时的状态去制作。在洛基扮演者汤姆·希德勒斯顿拍摄的间隙,我们会请他站在一个圆盘上,从各个角度拍照,然后生成一个 3D 模型。这个模型很粗糙,但身体的大致形状和衣饰的起伏都有,我们再以这个模型为基准制作数字替身。
数字人制作难度最高的是脸,脸上难度最高的是眼睛。我们每天见到那么多真人,对话的时候又多是看着对方眼睛,只要有细微的不自然,一下就会被看出来。比如为了让眼睛显得明亮,视效往往会给眼睛加上高光,但如果这个高光太亮太精致,反而让人觉得失真。在现实生活当中,并不是每一双眼睛都那么明亮,相对比较浑浊的眼睛,晶体组织的反光度就没有那么高。
2017 年上映的《银翼杀手 2049》是一部比较经典的科幻影片,其中一个致敬 1982 年《银翼杀手》的关键场景,是让《银翼杀手》中的女性角色瑞秋以当年 20 多岁时的状态再次出现在银幕上。为此视效公司 MPC 做了一个数字替身,请来当年瑞秋的扮演者肖恩·杨,扫描了杨的脸部形象,以她的骨骼为基底,再在其上覆盖一层皮肉,从而复原她当年的样貌。这个数字人做出来哪里都很好,我觉得唯一的遗憾,就是眼里的高光太亮了,作为专业人士,会本能意识到这是 CG 刻意为之。
▲ 《银翼杀手 2049》剧照,片中的瑞秋是数字替身。| 图源:豆瓣
除了眼睛,脸部视效的另一个挑战是皮肤。我们的额头、眼周、鼻周、嘴唇、下巴等不同区域的肤质、皱纹纹理、透光度、出油程度都不一样,因而反光度也不一样,一般要用好几十种不同的材质贴图,从各个角度把控,最后才能做出比较逼真的效果。
技术赋予了电影更天马行空的可能,但很多导演依然追求写实的风格,比如诺兰。
我最初进入视效行业,就是希望在行业内顶尖的环境里,和世界上最前沿的艺术家和工程师一起工作。结果没想到,一进公司就分到了诺兰的项目上。
在《蝙蝠侠:黑暗骑士崛起》里,我做了很多建模工作,包括蝙蝠侠的摩托车,巨大的球形反应堆等。我参与的几组镜头以实拍为主,但一些确实无法实拍的画面,就要靠视效来实现,比如蝙蝠侠驾驶飞机吊着反应堆在空中飞。制作时,为了让 CG 元素尽可能自然地嵌入实拍画面,我们要在一定程度上用三维复制出实拍环境,从而让 CG 制作的飞机在飞行过程中,机身上出现真实自然的反光。
▲ 《蝙蝠侠:黑暗骑士崛起》剧照。| 图源:豆瓣
诺兰非常执着于实拍出来的真实自然的质感,影片中会尽可能用实拍镜头。在《星际穿越》里,我要制作「冰封星球」的视效,就参考了导演和团队在冰岛实地拍摄的大量冰原素材。
▲ 《星际穿越》剧照。| 图源:豆瓣
不过,尽管诺兰常说自己的电影很少用视效,其实他的电影视效成分并不小,只是后期团队花了额外精力把视效隐藏得比较好。
比如《星际穿越》里有一个场景是空间站遭受撞击,在空中旋转。其中一个镜头是从空间站中心位置看出去,天旋地转。这个镜头就要用视效完成。因为即使去撞击一个实景搭建的空间站,也不可能拍出碎片失重状态下乱飞的样子。
这部电影里还有一个场景,是主人公掉入四维空间,被同一间屋子的各种「副本」包围。起初这组镜头以什么样的机位呈现,并没有预先设计,而是由视效先搭建出效果,给导演提供一些可能性,让导演知道,视效覆盖的角度和精度,以及相机可以架在什么位置上。
▲ 《星际穿越》剧照。| 图源:豆瓣
与很多其他导演相比,诺兰还格外偏爱 IMAX 画质。IMAX 的画面分辨率超过普通电影分辨率 4 倍以上,拍摄任何角色或环境,能呈现的细节会多很多,精度也要高很多,这意味着视效制作的难度和流程都会相应翻倍。
2022 年,ChatGPT 问世,这是 AI 和大语言模型的里程碑,也给视效行业乃至所有创意娱乐产业带来巨大震动。之前的视效技术,虽然也一直在迭代,但不管如何进步,都还没有跳出电脑图像的范畴。而 AI 带来的影响则像是珍妮纺纱机对于传统手工作坊的冲击,一下就极大提升了视效行业中某些环节的生产效率。
举个例子,影视流程中画师原先的一项常见工作,是针对一个需求,给出十几个乃至几十个变体方案(variation)。比如给钢铁侠的盔甲做出 20 个变化;再比如给街上行人的数字替身做出 10 套服装。在漫威这样体量的视效大片中,需要的变体尤其多。很多情况下,变体无需包含多少意义或精妙之处,仅仅是作为背景元素,却制作同样要花很多时间。有了 AI,原先一两周才能完成的工作,现在只需要几分钟。
▲ 《钢铁侠 3》剧照。| 图源:豆瓣
抠图也可以由 AI 完成。直到前几年,抠图都还是人工完成,因为很多东西机器抠不干净,但 AI 的智能识别功能,可以把一些像素上比较模糊,但从逻辑上判断应该分开的地方分开了。
再比如,视效流程中一个重要环节是拆分电影镜头,一般是视效总监和制片人一起,把剧本整个拆分一遍,再根据导演要达到的意图,以及自己的经验,判断每个镜头需要几个人几个部门用几天时间协作完成,需要多少钱。这个过程如果有了 AI 帮助,可以快很多。
不过,AI 目前尚无法给视效行业带来翻天覆地的变化,其影响还处于酝酿阶段。我最近和不少导演、视效总监等业内人士交流,大家也都觉得当下的 AI 应用更适合一些基础体力劳动,比如抠图,但无法立即取代视效的制作流程。
这主要因为 AI 生成影像的方式还无法满足影视制作的需求。影视从前期到后期,从概念到成片,是一个想象力和自由度逐渐收窄的过程。整个后期视效行业的存在,就是为了服务导演和制片方近乎偏执的、对于个别像素的追求。但 AI 生成的视频目前还不可控,也无法微调。对于业内人士而言,目前这些 AI 视频生成工具更像是一个「新玩具」。
另外,视效流程的链条非常长,需要不同部门严密协作。而处于所谓系统之中就会出现各种问题,这是算法还无法全盘解决的,必须由人做出各种估算和判断,并开发相应工具和流程。一部比较复杂的大片,要花很多年,成百上千个人去做,就是在对抗这种不确定性,是在规避和修补问题。
我认为,AI 对影视行业或任何与科技沾边行业真正深远的影响,不是帮你完成眼前的工作,帮你写一个角色,生成一张图、一个视频,而是作为一个工具,在快速学习和自我完善过程中,有针对性地生成工具当你有一个目标时,AI 可以帮你制定达成目标的计划,再帮你生成每一步计划所需要的工具,并且自检和迭代。
由此,AI 一定会对大家的思维方式和工作流程起到深远影响。如果回顾人类发展历程, 从石器时代,到农业社会,从工业革命,到数字时代,变革发生的速度越来越快。而从 ChatGPT 本身迭代的速度就可以看出,未来创新的出现会非常非常快,呈现井喷式的状态。
回到创作层面,我很有兴趣尝试各种 AI 产品,试图发现它们的边界。但如果我真的要创作一个角色、一个故事,反而不会依赖 AI。
我觉得所谓的艺术审美,就是欣赏那些可以被不断咀嚼、玩味、拆解、分析的,关乎于人内心最深层东西的作品。我更希望,在未来很长一段时间内,创作足够有深度的作品,都是人特有的能力。
在创作这件事上,无论是绘画、写歌、写词、写剧本、写故事,AI 最终无法替代的,是人的个性。而所谓个性,很多时候就是「缺陷」。每一个创作者都有自己的缺陷,从而形成风格。而机器是「完美」的。
比如艾伦·索金作为《社交网络》的编剧,就将自己的个性与创作很自然地融合在一起。《社交网络》讲的是扎克伯格和 Facebook 的故事,节奏非常快,常常 A 还没说完, B 已经插进来,然后 C 又插嘴,吵成一片。而索金本人就是话又多又密,他把这种习惯和偏好运用在创作中,形成了独有的节奏和观感。
我一直尝试训练出一个 AI 编剧助手,来刺激我产生新的创意,但效果不太理想。目前各个大厂的语言模型,都可以比较自然地组织语言,与人持续对话。但艺术作品给人的感觉,从来不是「饿了吃饭,渴了喝水」那样直截了当。越优秀的作品,多引发的感受越复杂细密,这种能量,来自于创作者的阅历、性格、技法偏好,以及独具魅力的「缺陷」。而目前的大语言模型是海纳百川式的,还没有达到形成个性的阶段。也许未来,有长期记忆的大语言模型像智能手机一样普及时,这种变化就会出现。
其实,不仅仅作为创作者,从观众和欣赏者的角度出发,面对越来越多流程化模式化的内容,也更留恋「有人味」的创作。人们对于千人一面的视效大片已经产生了审美疲劳。
这也是视效处境有些尴尬的地方。视效的出现是为了辅助导演把故事讲好,当技术还做不到无所不能的时候,人们会努力把故事讲到极致。但当技术成熟,可以轻松做出各种逼真效果时,就过于依赖视效,反而不注重讲故事了。
事实也证明,并不是技术更好,出来的影片效果就更好。比如《指环王》第一部(2001年上映)的视效现在看来可以说比较潦草,有的镜头人物大小比例和透视关系并不合理,但不妨碍电影非常吸引人。而 2012 年到 2014 年上映的《霍比特人》系列,把一本书儿童读物硬是注水拍出三部曲,为了增加技术上的噱头,又做成 3D 和每秒 60 高速播放,这些技术上的加分点,反而让观众非常出戏,成了影片的减分点。
▲ 《指环王1》剧照。| 图源:豆瓣
艺术的价值,除了娱乐和装饰,也在于记录、呈现、探讨「人的生存状态」(the human condition)。文学长期以来承担着这一功能,而电影又往往是从文学中获取题材和灵感。无论创作的工具是铅笔还是 AI,其最终目的都是相同的,那就是作为连接的媒介,让「人」被照见,被看见。
世代变幻,人性不变。同样,无论技术如何更迭,能给电影包裹上怎样炫目的外衣,电影的内核,也不会改变。
近期最打动你的电影是哪一部?来评论区分享一下吧。
监制/徐涛
采写/东君
视觉设计/Mori
排版、运营/Siti
更多有趣问题
欢迎来声动活泼找答案
继续阅读
阅读原文