作者、编辑:程天一
排版:Scout
“任何人都可以使用 CapCut 或 Captions,这是最有趣的部分。显然,我们尽量不告诉我们的客户这一点。”
这是一家社交媒体内容制作代理商对新一代剪辑产品的评价。它的大多数客户会每周拍摄 3-5 个视频,交由它进行剪辑、添加字幕和特效并最终发布。这些客户不亲自进行剪辑的原因可能是畏惧使用 Premiere Pro 这样高门槛的软件,但 CapCut 和 Captions 这样的产品正在通过用户友好的产品设计和 AI 驱动的智能功能改变这一点。
尽管 Premiere Pro、Final Cut Pro、Davinci Resolve 等数十年历史的老牌剪辑软件仍占据着专业创意人士的市场,越来越多的新兴剪辑产品开始出现并且展现出势能:从 17 年左右的 Veed、Descript,到 21 年的 Captions,再到最近的 Opus Clip 和转型过的 Runway。
有一系列的催化剂支撑着这些新兴产品:
• 商业趋势上,短视频、社交媒体营销中的视频内容以及创作者经济开始崛起,带来了拥有全新剪辑需求的数亿增量创作者;
• 技术上,WebAssemly 和 AI 大幅降低了使用一个完整的非线性剪辑引擎的门槛,让用户可以轻松在云上、浏览器里和移动端进行剪辑,并且将此前需要数个小时的操作缩减 10 倍。
由于技术的成熟和用户的需求非常匹配,这一赛道的产品一旦构建好非常容易获得用户并且冲到百万美元的 ARR,但是要建立差异化的壁垒和达到更大的规模有难度。从投资视角看,我们认为最终在成长性逻辑中取胜的玩家需要拥有一系列实际效果和用户体验显著优于竞品的功能。Pika Labs 和 HeyGen 等产品不在本文所讨论的剪辑产品的定义之下,但是它们可能正在创造一个 Filming less 的未来,将对整体的内容供给带来巨大影响。
以下为本文目录,建议结合要点进行针对性阅读。
👇
01 新一代视频剪辑产品的兴起
02 值得关注的 3 家成长期标的
03 现阶段的竞争胜负手
04 Filming Less 的挑战
01.
新一代视频剪辑产品的兴起
视频已经成为互联网上最重要的媒介。目前,视频内容占据了超过 80% 的互联网流量。
Source: Cisco Annual Internet Report
有趣的地方在于,过去十几年推动这一事实发生的有两股力量:
第一股力量是存量的专业视频内容的继续发展,比如下图中的专业影视剧、纪录片、真人秀、体育转播、新闻等,背后公司的典型代表是好莱坞、有线电视生态以及 Netflix 等新兴力量;
第二股力量则是增量内容,比如创作者经济和社交媒体趋势下的视频创造、播客视频化等。伴随着 YouTube、TikTok、Instagram 等平台的崛起,数亿的创作者开始首次制作和剪辑视频。
Source: Strada Pitch Deck by Business Insider
对应到剪辑软件上,专业内容和新兴的视频内容同样有两股力量:
至今为止,在 2015 年宣告退休的 Randy Ubillos 似乎仍是视频剪辑软件历史上最重要的人 —— 他在 90 年代带领 Adobe Premiere 1.0 问世,随后又缔造了 Apple 旗下著名的 Final Cut Pro 和 iMovie。这些产品很快将 AVID 拉下马,成为了专业创意人士最重要的剪辑工具。
这些产品在过去十年也经历了云化和 SaaS 化的过程,将大量的专业剪辑工作流 Know-How 沉淀为软件功能的同时大幅降低了成本和定价。对于大多数专业创意人士来说,即使会使用一些新兴的工具,他们仍然会将 Premiere Pro 定义为自己剪辑工作流的基石和中枢。
尽管专业人士的市场被这些老牌软件统治,字节跳动的 CapCut 显示出第二股力量为视频剪辑带来的另一种可能性,即让视频创意和制作民主化。在 2020 年对海外市场发布后,CapCut 花了不到 4 年时间已经突破亿级用户,而 Premiere Pro 所在的 Adobe Creative Cloud 目前仅拥有 3000 万上下的订阅用户,Final Cut Pro X 在发布后同样时间里只有 200 万用户。
这一市场还在迅速地扩大。如果全球超过 20 亿的短视频用户最终能有超过 10% 被转化为创作者并愿意为剪辑产品付费,那么我们可以预期一个 200 亿美元体量的增量市场。同时,这些新兴创作者的整体内容创作工作流和剪辑需求与专业人士的有较大差异:
在整体 TAM 迅速扩大并且存在巨大的需求差异化的情况下,我们正看到一系列新的创业公司带着独特的价值主张在过去 3-5 年里出现:
「海外独角兽」制图,仅供示意
这些产品普遍具备以下特点:
• 比 Premiere Pro 等产品更低的定价;
• 产品易于上手,提供接近完整但并不强劲的非线性剪辑产品,通常提供 trackless 的能力;
• 各自拥有一个独特的拿手绝活;
• 基于云的实时协作、通过浏览器或移动端 App 交付产品;
• AI Native 或正在积极嵌入 AI 能力。
02.
值得关注的 3 家成长期标的
视频剪辑本身是一个非常“创始人友好”的赛道,因为用户需求明确而且付费意愿强。目前以“实时协作”和“浏览器中就可以使用”为卖点的 Figma for Video Editing 产品非常多。在产品打磨好之后,这些产品一般也都会很快进入付费才能使用的商业化阶段,有几个案例可以印证这一点:
• Veed.io 在早期是完全 bootstrap 发展,在达成 10 万美元 ARR 之后仅仅用了 9 个月的时间就将收入扩展到了 200 万美元 ARR;
• Captions 从产品面向大众推出的第一天就必须付费才能使用,已经拥有超过 300 万创作者用户,DAU 超 10 万;
• CapCut 早期以免费版著称,但是很快为 Pro 付费设置了许多关键的功能点,根据 Data.ai 在 9 月份的报道,其 App 在 iOS 和 Google Play 上的消费者支出已经超过 1 亿美元。
我们在上一章总结的几个产品是在创作者和企业客户访谈中最常出现的几个名字。在它们之中,于成长逻辑上,有三家公司排在我的 Watch List 前列:
Descript
「海外独角兽」在之前的文章已经详细介绍过 Descript
值得留意的一个趋势是视频播客的兴起。在与我们交谈的大多数创意专业人士眼中,Descript 仍然被视作一个音频和播客剪辑工具,他们通常认为“音频的大小、工作流复杂度、剪辑和视效需求是视频的很小一部分”。但是在过去一年我们观察到,随着美国播客生态变得更卷,视频播客正在被越来越多的创作者考虑,2022 年美国有超过 5 万档视频播客,YouTube 逐渐变为播客收听的首选平台,Spotify 也推出了可观看的视频播客能力。
Descript 很有可能受益于这个趋势。它拥有完整的且对于视频播客来说够用的非线性剪辑能力,并且已经有视频创作者开始深度使用它。以 MarTech 公司 Chili Piper 的营销团队为例,他们将举办的活动内容以播客、中视频、短视频的方式分发,将 Descript 用于粗剪环节,比如将 30 分钟的内容先剪到 10-15 分钟。
Descript 在今年 8 月收购了远程录制产品 SquadCast,将进一步推动创作者在 Descript 单个平台内完成视频播客的录制和剪辑。
Runway
Runway 也在我们之前的文章中被详细介绍过。
经常被忽略的一点是 Runaway 拥有一个接近完整的非线性剪辑器,并且很好地跟它拥有的 AI/Ml 能力进行了融合,这将构成它和 Pika Labs、Stable Video 等竞争对手的一个重要差异点:
在 r/Filmmakers 以及其他的视频创作者社群,我们观察到 Runway 已经变成 AI 剪辑的代名词,许多创作者实际上并非 Gen-1 或者 Gen-2 炫酷的视频生成能力的用户,他们更多地夸赞 Runway 实用的动态转描和绿幕功能。如果说上述的视频剪辑产品中谁最有潜力向上在专业创意人群中挑战 Premiere Pro,Runway 可能是最有希望的名字。
Captions
全球的消费者产品中,有两家对于摄像头的洞察和利用最极致:一家是抖音/TikTok,另一个是 Snap。Captions 由 Snap 的前 Design Engineering 团队的领导者 Gaurav 创立,是一个主打移动端 App 的产品,但是也正在向桌面延伸。
鉴于 CapCut 无法被单独投资,Captions 可能是移动端短视频及社交媒体内容剪辑趋势下最值得从投资视角关注的公司。根据 Forbes 的报道,它已经很难得地实现了盈利。
整体而言,Captions 的兴起受益于短视频,它的第一个王牌功能也是至今仍然被创作者们最推崇的功能即自动配字幕,准确率远高于 Premiere Pro 内的同款功能。和 CapCut 相比,Captions 的整体功能和 UI 更简洁(CapCut 已经逐渐被创作者们认为是一个“中等”复杂度的产品),把字幕和贴纸能力做到了极致,还在不断迭代 AI 能力,推出了 AI Eye Contact、AI Dubbing、AI Music 等能力。
除了 Captions 这个 App 之外,这家公司还在 10 月推出了主打多语种配音及对口型的产品 Lipdub,和 11Labs、HeyGen 等产品的部分用例重合。目前 Lipdub 的势头不错,拥有一个很长的 waitlist。
03.
现阶段的竞争胜负手
进入视频剪辑赛道的门槛是起码拥有一个及格线以上的非线性剪辑器,Runway 的 Cris 去年接受 Scatter Brain 的采访时对于这个问题有一个非常精彩的评论:
从模型目录过渡到视频编辑平台的最大挑战并不在于人工智能方面。我们已经知道我们的模型将如何帮助增强和加快用户的工作流程。挑战在于构建基本的编辑功能,以确保我们达到了及格线。我们必须了解那些最重要的核心功能,以及如何构建它们。
考虑到视频编辑本身非常同质化,仅仅构建一个带有微小改进的视频引擎并期望将用户从传统工具中转换出来是不可能的。这是一个非常饱和的市场,拥有典型的编辑功能是及格线;这不是一个差异化因素。为了真正超越现有企业,您需要制定一项战略来持续打造市场上全新的创新产品。如果你创造了那些伟大的产品,其他一切都会随之而来。
当我们考虑 Runway 中的视频编辑时,我们认为它是通用工具中的一项功能,而不是核心差异化因素。这就是视频和图像合成生成以及内容自动化研究的用武之地。而这是 Runway 的最终差异化之处。迄今为止,该技术的应用主要集中在编辑领域,但我们在创意领域看到了越来越多的可能性,并通过文本转视频等新工具向它倾斜。
上半场:走向云和移动
我们判断当前阶段小组赛上半场已经踢完,代表性的事件就是继 CapCut 的成功之后,YouTube、Canva 这些巨头已经入场并且产品打磨得还不错,各个新兴创业公司把重要的价值主张也都抢占掉了,留给新的、还未建立和推出产品的创业公司的空间已经非常小了。
抛开短视频这个显而易见的催化剂之外,上半场最重要的技术变量是 WebAssembly,这一技术的广泛应用让在浏览器内交付一个完整的非线性剪辑引擎成为可能 —— 这是一个非常重要的范式转变,因为流畅使用 Premiere Pro 通常需要 8GB 的 RAM,而一个相对轻量级的 DaVinci Rsolve 也需要下载 3GB 以上的安装包,阻碍了许多用户使用这些老牌的剪辑软件。
在这一技术趋势兴起前,剪辑以及后期制作实时协作的代表性公司是 Frame.io,它的产品基于 Premiere Pro 等主流剪辑产品,并不打造自己的剪辑引擎。而新一代的产品巧妙地在浏览器内兼顾了云上协作与完整剪辑能力的可触达性。
搭配使用 Frame.io 与 Premiere Pro 的效果
目前 WebAssembly 已经成为了新一代视频编辑器的标配,也是各个新兴玩家确保自己价值 downside 的地方 —— 当微软希望在 Win 11 内置一个轻量易用的视频编辑器,它没有内部开发,而是收购了一家名为 Clipchamp 的公司。

下半场:全面拥抱 AI
鉴于实时协作、通过浏览器交付产品等价值主张迅速同质化,所有玩家都必须寻找新的差异点。
崛起的 GenAI 成为了很好的抓手,在传统后期制作的每一个单点上都可以提供具体的功能来帮助创作者大幅提效(下面以 Captions 为例):
• 智能修剪:比如一键删除沉默、口癖和填充词等片段,可以将传统需要花费数十倍于素材时长的剪辑过程自动化;
• 语音增强和纠正:自动消除背景噪音并且增强语音质量,还可以一键纠正任何录制以及语音中的错误;
• Eye Contact:让人物眼神正确地注射相机方向和位置,从而让内容更具感染力;
• Lip Snyc:通过改变嘴唇形状和动态来更好地匹配被编辑过的内容;
• AI 驱动的调色和配色;
• 背景擦除和人物剪切;
• AI 驱动的多语言配音;
• AI 进行的长视频到短视频剪辑;
……
整体而言,由于音频和图像的模型门槛并没有语言模型那么高,这些功能正在变为各个产品的标配,比如 Premiere Pro 也正在拥有以上功能中的绝大部分。
Premiere Pro 提供的字幕能力
但是当前阶段,每个成功的产品仍然有其最独特的一个 AI 能力来吸引用户进入,我们在客户访谈中观察到许多案例:
• Captions 吸引创作者的首要能力是其字幕功能,虽然从 Premiere Pro 到 CapCut 都具有这一功能,仍然有相当多的用户认为 Captions 提供了更高的准确度、更多的字体和颜色定制选项、更丰富的 GIF 和 EMOJI 以供一同插入;
• Descript 除了其本身基于文本的剪辑除外,经常被提及的 AI 功能是 Studio Sound,这一功能被一位创作者描述为“让你的音频听起来像去 NPR 的录音棚用了价值数十万美元的设备录制一样”;
• Canva Video Editor 通常被用于尺寸调整,它拥有最丰富的社交媒体平台兼容性,通过 AI 功能可以一键调整要发布视频的尺寸。
随着竞争进一步加剧,我们预计 AI 功能的深度和广度都将更加重要:
• 只有单个功能做得显著比竞品好,才能显现出差异化。而一个剪辑产品在市场中不断扩大知名度的绝佳方式是社区中不断有 show case 出现,当越来越多的教学视频被创建,人们将默认把它用于这一任务;
• 能够在更广泛的 AI 功能上都做得比竞品好将是决定性的优势,因为当前创作者的剪辑工作流正在变得更分散,使用不同的工具(各个单点上最好的)用于主要剪辑、配字幕、调色、画质增长、视效等,建立单一平台内绝佳的 AI 体验将改善这一分散和割裂的现状。
04.
Filming Less 的挑战
AI 对于后期制作和剪辑的提效作用非常直接,并且效果已经完全可用,因此短期内视频创作的变化发生在这一环节。
但是不能忽略的是生产环节也正在发生变化,即 Filming Less 的潜在趋势,在拍摄成本越来越高的情况下,用生成的内容来进行替代是一个显而易见的趋势。
推动这一趋势出现的有两类具体产品:
• Runway、Pika Labs 等视频生成产品;
• HeyGen、Sythesia 等数字人产品。

围绕这两类产品的乐观讨论有许多,但是根据我们与 Adobe、Apple 旗下剪辑产品的业务操盘手们的交谈,还有一系列挑战等待被克服,下面按照从重要到相对可被克服的顺序排序:
• 大众对于”视频“的概念有分化。许多时候,大家的期望不是一个动画或者动态图片,而是一个拍摄或者录制的东西,能捕捉到现实瞬间的作品;
• 跨越“怀疑的鸿沟”。我们看一个角色的眼睛还是能察觉出来它不是真人的,现在你给顶级特效公司几百万美元,它们可以帮你做出来几秒钟在大银幕上让观众感觉实际、非常真实可信的东西;
• 生成的内容缺少可持续的商业模式支撑。人们支付 Adobe 或者 CapCut 那么多订阅费的原因是他们可以从作品中赚钱或获得影响力,但是当前视频生成的用例很难达成这一目的从而推动整体用户付费的可持续性;
• 当前的模型生成质量差,并且还无法做细节的调整。
如果这些挑战被克服,新兴的视频剪辑软件将需要和视频生成产品探索某种程度的竞合关系,比如如何互相嵌入彼此的工作流。而像 Runway 这样已经构建了在及格线以上剪辑能力的产品,将有机会成为新型的 All-In-One 视频制作平台。
延伸阅读
专访Pika Labs创始人:探索视频生成的GPT时刻
Mistral AI:欧洲最强模型团队,打造开源轻量LLM
2023独角兽市值分析:Gen AI的崛起与地域分布
Figure:为人类部署数十亿台人形机器人
Endor Labs:比Snyk更进一步的开源安全卫士,Prisma Cloud操盘手创立
继续阅读
阅读原文