"人们在行业转型的过渡期会看不清方向,而 AI 正处于这样一个阶段。
作者| Ben Thompson
翻译 | Lavida,wenli,Gisele
本文编译自 Stratechery 主编 Ben Thompson 与Nat Friedman、 Daniel Gross 关于 AI 热潮的访谈。
Nat Friedman 和 Daniel Gross 是硅谷著名 AI 投资人,Daniel Gross最近入选时代杂志AI100人榜单。
他们在 2017 年搭档成立了“AI 领域的YC”——AI Grant,也因此在早期就参与投资了Character.aiPerplexity AIWeights & BiasesScale AI 等 AI 领域重要公司。今年 6 月,他们又推出了 Andromeda Cluster 计划,是一个价值 1 亿美元、拥有 10 exaflop 计算能力的 GPU 集群,并将其开放给自己的被投企业,为 AI 领域的早期创企业提供计算资源支持。
在成为投资人之前,Daniel 和 Nat 都是成功连续创业者。Nat 参与创办了开源跨平台 SDK Xamarin,并在 2016 年被微软收购。2018 年,Nat 带领微软收购了 GitHub,并出任 Github 的 CEO。Daniel 曾创建过搜索引擎公司 Cue,后被 Apple 收购。
Nat 和 Daniel 也将 AI 和之前的技术、科技投资周期进行了对比,指出当下的 AI 投资一定存在泡沫,但同时也坚信 AI 一定能带来真正的颠覆式创新。借用英特尔创始人Andy Grove 的观点,人们在行业转型的过渡期会看不清方向,而 AI 正处于这样一个阶段:现在看起来的 big thing,未必能够长存;相反,一些现在还小的公司,以后可能会成长为有影响力的大公司。
我们整理了一些关键性信息,分享给大家:
01
ChatGPT真的不行了吗?
Ben Thompson:媒体上有传言说 ChatGPT 的使用量下降了。
Nat Friedman:我个人认为这应该不是真的。ChatGPT 目前的使用非常广泛,我们暂时还不知道关于 ChatGPT 的确切数字,有传言说,综合不同的收入来源统计,总共大概有 10 亿美元的收入。
如果从 Similarweb 的统计看,可能会觉得 ChatGPT 使用有所下降,但我认为这里其实忽略了几点:首先,ChatGPT 已经推出了移动 App,这可能分走了部分网页端流量。其次,暑假因为学生没有家庭作业,ChatGPT 也许暂时使用量下降,但这可能只是临时因素。
Ben Thompson:是的。我也认为这是一个大问题。到目前为止,ChatGPT 的第一大用例就是帮助学生解决家庭作业,但孩子们暑假没有那么多作业要做。
Nat Friedman:完全同意。但这种流量衰减没有持续多久也表明 ChatGPT 在商业领域的应用正在增加。尽管学生人群的访问量可能减少,但在这个过程中 ChatGPT 的收入一直在稳步增长,因此可以推测是实际的商业使用在增加,并且这还是在他们推出 Business 和 Enterprise 版本之前。在推出 ChatGPT Enterprise 这一企业级产品后,OpenAI 可能会通过 SSO 和数据安全保障等手段提高价格。
所以,我认为 ChatGPT 有极大可能在明年成为一个价值 30 亿到 50 亿美元的业务,企业应用是必须考虑的一点,我在各行各业都遇到过日常每天使用 ChatGPT 的人,市场营销、法务等等,也许他们使用频率还没到用 Google 那么高,但他们确实已经从中获得了价值。
Daniel Gross:我的观点是 ChatGPT 既被高估了,也被低估了。
高估的原因是看到了使用率正在放缓,虽然学生是 ChatGPT 的早期用户,并且这一代人有可能会一直使用它,但他们还没有太多的购买力。
而我认为它被低估的主要原因是,使用率在实际用途面前并没有那么重要。如果 ChatGPT 只是被用来为网站生成复制营销文本,那就没什么意思了,但它在编写代码方面的应用度也非常高,而且显然能创造的价值也更大。
OpenAI 目前在定价和细分上还不够精细,定价上有些问题,还不能区分用户群和用途价值。如果能看到更详细数据,可能就会注意到 ChatGPT 整体使用曲线可能在放缓,但在某些高价值应用场景使用强度在增长。因此,OpenAI 可能需要完善其 ChatGPT 的货币化模式,我认为这是一件好事。对学生家庭作业等场景是否真正产生商业价值还有待判断。但 AI 产业整体来看仍有潜力,如埃森哲这样的公司就能从软件业务中每年获得数十亿收入,这是一个值得关注的领域。
Ben Thompson:还有一个问题,你刚提到 ChatGPT 存在巨大的商业潜力。虽然公司的决策并不总是出于理性,不过我从理性角度来看认为,微软在 API 和企业方面表现十分出色。在科技行业,打造一个有实际意义的消费者品牌是最为稀有、也是最能获利的机会。尽管 ChatGPT 的使用率有所下滑,但考虑到其庞大的用户基数,其用户留存率实际上令人印象深刻。
OpenAI 完全有潜力转型为一家面向消费者的公司,但我不确定他们是否有这样的企业文化或足够的动力来实现这个转变。这方面有什么最新进展吗?他们现在已经开发了自己的 APP,并加大了 To C 产品人才方面的招聘力度。但在你看来,OpenAI 只是被迫进入,还是说从战略层面发生了变化?
Nat Friedman:我们可以说 OpenAI 无意间推出了一款超级应用,Sam 和 Greg 也都很懂怎么搭建产品,但 OpenAI 从一开始的目标就不是做 to C 市场,显然他们在产品化方面还有很多学习和改进的空间。未来他们会不断改进产品,但是不是已经完全转向这种模式现在还并不明确。产品化的进程也许并不重要,关键在于 OpenAI 能否保持高增长,如果增速足够惊人,到时候没有人会觉得有谁会打败这家公司。
我们显然可以把 ChatGPT 变得更具商业应用潜力,更实用、更吸引人,并带来更多的盈利。尽管如此,考虑到他们所拥有的快速增长的消费者产品,或者说是增长最迅速的 AI 产品,真的很难对他们提出批评。我认为他们有目前最好的模型,没有任何人能超越。Claude 2 也表现得非常不错,但它还是比不上 GPT-4,GPT-4 可以用于编写代码,而 Claude 2 则在这方面有所限制。
Ben Thompson:我听说,越来越多的非科技行业的人士对使用 ChatGPT 时的数据隐私表示担忧,甚至有的公司禁止员工使用 ChatGPT。谁在控制这些数据呢?Microsoft 和他们的 Copilots 是否坐拥有利的位置?这是否也是人们对 Palantir (一家成立于2003年的美国科技公司,专注于开发和提供数据分析软件和服务,)感到兴奋的原因?
Nat Friedman:Azure 为客户提供 OpenAI 的模型服务,并明确表示不会使用用户的数据进行训练。OpenAI 已经针对这种担忧做了策略上的调整,不再基于 API 的使用情况对模型进行训练。但如果你通过他们的网站或应用与 ChatGPT 互动,他们的确会收集你的使用数据,用于产品的持续优化和训练,我觉得他们在这方面还有提高的空间。未来,专为企业打造的 ChatGPT 版本或许还会提供选择,虽然价格可能会是三倍更高,但他们会承诺不使用、也不保存你的数据进行训练。他们之前有朝着这方面进行调整,且在受到 Anthropic 等竞争对手的压力影响下,会一直持续调整。
02
Llama 2 与本地模型
Ben Thompson:怎么看 Meta 推出 Llama 2?
Nat Friedman:Meta 这么做很利于初创企业。在我参加的一个 AI 初创企业的 demo day 上,其中 30 多家初创公司进行了 demo 演示,很多公司都把 Llama 2 fine-tunes 作为产品的一部分,很震撼。显然能够自行托管并微调 Llama 是大家的共同追求,这让开发者有了掌控感,而 Llama 2 确实也很强大。我们都听说过 Code Llama 即将推出的传闻,听起来他们将会继续做迭代并定期发布 Llama 的新版本。
至于 Meta 为什么这么做,我觉得是因为他们已经在 AI 领域做得很深,并且这对于吸引顶尖人才也是一个巨大优势。Meta 现在看起来就像是一个很有活力的 AI 工厂,吸引了优秀的工程师。这个模型对 Meta 来说就像是一种补充产品,开源就像是将其商品化,Meta 借此提供了平台,支持各种不同的 AI 产品的开发,像是 Instagram 上的 AI 滤镜、WhatsApp 上与你互动的 agent。所以发布开源模型可以说有益无害,既加强了 Meta 的竞争力,也让优秀的 AI 工程师更倾向于选择 Facebook。
Ben Thompson:在智能手机时代的最初的七八年中,Apple 和 Google 之战很重要。在一开始,Apple 和 Google 在当时也是完美互补:Google 有 Google Map 这样超级应用,而 Apple 则有优质的硬件。最终,Google 最先意识到,“我们必须确保我们的应用在 iPhone 上的表现就像在 Android 上一样出色”,但这肯定花费很大。例如,Apple Maps 是一个有很多用户的应用程序,如果 Google 没有采取这种方法,它可能不会有今天的地位。
Apple 与 Meta 的竞争是当下 AI 领域的 Apple 与 Google 之战吗?Daniel,你刚提到回顾过去十年的应用变迁,自那时以来有个一直存在的主题就是 Meta 应用程序。Meta 应用是智能手机无限可能性的最重要体现,他们做了很多工作,让用户通过随身携带来做各种事,也构建了如今的 App Store 生态。
Meta 的应用平台和 App Store 是非常互补的组合。当有更多数据产生的时候,通常是在 Meta 平台被消费和发布。而生成这些数据最有效的方式往往是在本地完成,那进行本地数据处理的最佳设备是什么?很可能是 iPhone。Llama 2 应该针对苹果的芯片进行优化,并内置于操作系统中,这应该是一种美妙的合作伙伴关系,但这似乎不太可能发生。
Daniel Gross:是的,这很有意思。开源软件的一大好处是可以合作,而且由开源社区来实现这点也很有意思。我们的其中一家公司,GGML 应该是在边缘设备上运行类似 Llama 2 模型的主要方法。其实 Meta、Apple 和 Google 的许多人都在用,只不过为了避免麻烦都是悄悄的,但如果它们能够联手合作就完美了。
GGML 是一个张量库,专为商用硬件上的高性能机器学习而设计。由 Ilama.cpp 和 whisper.cpp 使用,这个强大的库提供高效和有效的建模功能。GGML.ai 是一家由 GeordiGerganoy 创立的公司,旨在支持 GGML 的持续发展,初始资金由 Nat Friedman 和 Daniel Gross 提供,致力于设备端推理的理念。
在开源领域就没这么麻烦了,我们可以实现更深度的集成。我一直在考虑 Llama 2 的问题,觉得现在的配置可能被夸大其词了。要使其在价格上与 GPT-3.5 相竞争,我认为它应该能在每小时 75 美分的 GPU 上处理每秒 100 个 token。而高性能的 A100,也就是上一代 GPU,现在的成本是每小时 1.5 到 2 美元。
我觉得很多人并没有真正以 GPT-3.5 相似成本的方式来运行 Llama 2,二者性能也不尽相同。不过,未来它肯定会得到优化和改进。很多人都喜欢使用和给 Llama 纠错,我真的认为这为 AI 的可解释性提供了一个很好的途径,拥有这样的模型确实是一大优势。
Ben Thompson:如果云端的成本持续降低,本地模型的存在是否还是必要的?
Daniel Gross:本地模型将肯定会成为云端的重要补充,比如,对于一些简单任务,例如自动补全询问“法国的首都是什么”这些问题,完全可以在本地来完成。
即将发布的最新 iOS 版本中已经实现了一个真正有效的自动纠错功能。我相信这是一个亚秒级的 Transformer 模型,它可以实时响应你在 iPhone 上的每一次键盘敲击。这背后其实有一个感人的故事,这是一位苹果公司的工程师倾注心血的成果,你可能永远也不会知道这位工程师是谁,他可能永远不会出现在某个主题演讲中,我们也见不到他。我并不是想把这变成一个苹果的广告,但我认为这就是他们可能会对待人工智能的方式。我觉得将来会有很多本地模型,它们偶尔会连接到云端的父模型,尽管这样做会消耗更多的能源。本地模型会变得更加智能,但云模型也会保持一定的比例,并持续进化。
Ben Thompson:而且更便宜。
Daniel Gross:是的,我有时会思考这样一个抽象的问题:我认为普通人每天大概需要 100 到 200 瓦特的能量,而普通的 iPhone 可能只需要四瓦特。基本上,我作为一个生物计算机,每天消耗的能量大约是 20 台 iPhone,或者说 40 台 iPhone。我可以编程,我认为我和 GPT-4 一样好,有时甚至更好。所以,我确实想知道本地模型能达到多好的性能呢?因为从能量消耗的角度看,我们的智能在某个时候能在 iPhone 上运行并不遥远。我们可能相差两个数量级。我认为,基于 4 瓦特工作的本地智能实际上可以走得很远,我们就是很好的例子。
03
GPU 供给失衡
Ben Thompson:我一直对商业模式及其产生的影响很感兴趣,其中需要特别点出的是目前 AI 领域中的推理成本问题,这意味着实际的内容生产并非零成本。回到面向消费者的公司,如 Midjourney、Character.AI 和 ChatGPT,它们主要采取的是哪种商业模式?是订阅制吗?像 Microsoft 推出的每月 30 美元的 Copilot ,还有其他的企业级公司提供了各种各样的附加服务,这在有明确成本的背景下都很合理。
再回到网络,遍布全网的是那些免费但充斥广告的大公司。在一个几乎零成本的环境中,这种模式非常有效。如果要运营大数据中心的大公司如 Google 或 Facebook ,你需要大量投资,但对他们来说,这些成本在边际上几乎可以忽略。或许对 AI 而言,最大的问题是,这些公司是否会进入到一个阶段,即推理的边际成本对他们来说几乎可以忽略,从而创造出广大用户所认可的产品?你认为我们已经在这条路上了吗?
Nat Friedman:我觉得我们其实还没有达到那个程度。我预测未来的趋势是,现在被视为前沿技术的东西可能最终会被大众化,但之后我们又会迎来新的前沿技术,它们需要更先进的硬件支持,我们对技术的期望也会随之提高。比如我认为推理能力会是一个重要的发展方向。
我曾与 Daniel 讨论过这个话题。Midjourney 能取得巨大成功,部分原因在于他们能够扩展其推理能力至很多的 GPU 上,利用那些未被充分利用的 GPU 进行大量的推理工作。我觉得他们之所以能够做到这一点,是因为他们是第一个这么做的,如果现在有人想创建一个与 Midjourney 类似的平台,他们需要付出比 Midjourney 更大的努力来获取必要的推理资源。
实际上,我们注意到 Llama 2 正在推高 A100 的需求,那些希望在数据中心中使用 Llama 2 进行推理的公司需要自己寻找 GPU。令人感到奇怪的是,尽管 A100 是三年前的产品,并且如 Daniel 所指出的,它属于上一代技术,但它的需求仍然很高。Nvidia 在六到八周前已经将 A100 的售价提高了 18%。然而现在,H100 已经成为市场上的新宠。
Ben Thompson:一年前 Nvidia 还报废了大量库存,太不可思议了。
这些库存其实是他们过去的积压产品,同时也是 Nvidia 业绩惊人的原因之一。关于 Nvidia 财报值得关注的一大问题是:GPU 市场会有何走势?Nvidia 是否能维持其领导地位?无疑,Nvidia 目前在硬件和 CUDA 两方面都占有优势,但竞争对手都在大力努力缩小这一差距,那么 Nvidia 能否维持领先地位呢?
Nat Friedman:接下来几年将会是 Nvidia 和 Google TPU的天下。
TPU 对 Google 来说是一笔巨大的战略资产。Google 是唯一一个拥有独立的硬件加速器的公司,尽管在制造工厂(fabs)和供应链的其他部分存在一些重叠,但它们不受其他公司(如 NVIDIA 的 CEO Jensen Huang)分配给它们的 H100 GPU 的限制。Google 可以自行分配 TPU 资源,而且据说他们正在以创纪录的数量生产 TPU v5。
Ben Thompson:你的意思是,对付 TSMC 比 Nvidia 更容易。
Nat Friedman:确实,至少没有 Nvidia 的瓶颈问题。现在 Nvidia 有大量需求,但供应却非常有限,因此必须非常精细地分配 GPU 资源。这样的中心化资源分配实在是令人难以置信。所以,即便有人说“AMD 的芯片会和 Nvidia 的一样好”,但明年他们也无法生产出足够的量。在我看来,在接下来的几年里,仅有两家主导公司,而市场将会受到供应短缺的影响,特别是随着更多 AI 应用的崛起和对推理能力的需求增加,以及更多公司想要训练大模型。
Ben Thompson:那么问题是,现在是不是一个过热的阶段,几年后我们回过头来,会发现当时生产和购买了过多的 GPU,导致市场供过于求?就像去年的 Nvidia,但规模可能是那会的 100 倍或 1000 倍。不过这种过剩可能会对 AI 产生巨大推动作用,因为有了 2023、2024 买的已经折旧的 GPU,计算成本会降低很多,利用。一旦市场崩溃,那就好像回到了过去的互联网泡沫,很多公司在大量铺设光纤后迅速宣告破产。
Nat Friedman:那就产生了很多暗光纤(铺设但未被使用的光纤)。所以供应短缺之后到底会不会出现过剩呢?我认为会的,而且对 scaling law 的坚定信仰可能也是一个重要因素。本质上,你投入的训练数据和浮点运算越多,你将得到的模型就会越好,从 GPT-1 到 GPT-4 每次一个数量级的跃升都证明了这点,所以未来在 GPT-5 上我觉得也会看到。
未来可能只有少数实验室有能力承担训练 GPT-5 或 GPT-6 等价模型的成本,而所有的初创公司,除非是做垂类小模型,否则就会被市场淘汰,从而形成“逃逸速度”(escape velocity)的现象。可能将会有三四家公司能够负担得起训练 100 亿美元的模型,而且这实际上是有限数量的 GPU。
Ben Thompson:你描述的基本就是现在 fabs(半导体晶圆厂)的情况,过去所有人都想产自己的芯片,但后来因为成本太高,所以就只剩下一个独苗了。
Nat Friedman:按现在的趋势发展,这可能也是我们的未来,因为成本变得太高了,要推出一个通用模型可能需要 1000 亿美元的投资。我们的实际行动也证明这点了。
04
大模型的发展趋势
Daniel Gross:我认为 B 端往往是进步的开始,大家通常都会瞄准企业来去做改进,比如早期的电视节目是以广播节目为基础进行转化的,以及 Horseless Carriage(无车马车,即最早期的汽车,以内燃机驱动,但外形上仍旧是马车)的起源等等。所以我认为目前很多 AI 产品还属于 V1 版本,它们的目标仅仅是利用技术可以实现自动化,因为现在可以进行自然语言交互了。
以后的 AI-native 应用案例将更多地面向消费者,这些应用将完全不同,它们不再是取代之前的某个过程,而是创造了以前从未有过的全新功能。就比如现在互联网上消费者能体验到的东西,其实和以往任何事物都不一样。
Daniel Gross:之前有观点认为,机器人(Robotics)会非常擅长蓝领工作,但机器在人类心理学方面表现非常糟糕,心理学正是人与人之间联系的最后一个领域。可事实证明,机器人(拾象注:这里主要指对话机器人 chatbot)在心理学方面表现非常出色,在实际劳动中的灵活度几乎为零。
Character.AI 就是一个很好的例子,现在出现了许多这类 AI-native 的行为,比如说在 Character.AI 上,你可以整天和一个 Chatbot 聊天,有个特别好的问题就是“你以前都在做什么?”这样你就可以弄清楚这个 Chatbot 的实际用途,通常他们都花费了大量时间在游戏或社交媒体上。
预测未来是非常困难的,就像当初看到 iPhone 我们无法预见 Uber 的出现,或者看到互联网无法预测到亚马逊一样。现在这些机器人通常是为消费者体验而设计的,它们会成为真正具有颠覆性的事物,而企业也会获得可观的好处。相当于我们以前雇佣的是一个人,现在则是一个能得到机器人协助的人(Person in a co-pilot model)。
我认为如果 AI 技术给企业带来颠覆,那很可能来自于一种全新的原生用户体验。这类颠覆通常属于 Clayton Christense 式的低端市场干扰,但 AI 可能带来的影响规模要大得多。目前很多公司试图利用 AI 完成高端法律工作,但模型在判断和依据方面的不足也需要解决,而低端服务,如支付 500 美元询问律师租赁相关问题,使用 AI 助手有可能更高效。总体来说,AI 很可能通过提供低成本的初级服务,对低端法律市场产生深远影响。
Ben Thompson:但像 AI 法律助手这种能够无限扩展、但又可能会比高端律师犯更多错误的法律咨询模式,是非常具有颠覆性的,因为提供高端法律服务的人日常并不会涉及到简单的法律咨询服务,也会顾虑工作数量和交付质量之间的平衡,但 AI 则可以。虽然可能会犯错误,但它的使用量更大,更容易访问,因此反馈和改进的速度也更快,以至于时间久了,未来法律 GPT 可能会超过高端律师,而高端律师仍然会犯错误,但到那时他们已经束手无策,无法做出应对。
Daniel Gross:是的,未来消费者也许可以接受更高的失败率、完全新的范式或者与以前完全不同的事物。
Nat Friedman:最近半年有一个很明显的趋势是大模型和生产力场景的结合。换句话说,这些模型通过自动化,替代或强化了企业内部某些工作流程,它们的竞争对手不是软件,而是一些工作岗位,是“知识型工作者”。
例如,我们最近了解到一家名为 AutogenAI 的公司,它可以自动为政府采购中标企业递交申报材料。这给企业节省了大量时间,取代了许多以前需要顾问来做的重复性智力工作,这家公司未来会有非常广阔的应用前景,让企业有机会去申请更多项目,从而获得更高的中标机会,进而实现收入的提升,这家公司目前增长相当迅速,可以看作是一个成功案例。
个性化虚拟形象视频生成也是个很好的例子,并且这个领域已经形成一个完整的产业,人们可以在平台上定制视频,甚至插入自己的声音,比如“哈喽 Ben,我注意到你对我们的产品感兴趣,我来给你介绍下……”大概流程就是生成文本,输入进虚拟形象平台,然后生成逼真的个性化虚拟形象,将其应用于广告、个人对外沟通、培训等场景。相比过去因成本所限无法制作视频,现在这项技术这样大大降低了门槛。目前比较知名的公司有 Synthesia、D-ID、Hayden 等,它们都在这个领域表现突出,业务增长迅速。
另一个相似的是电商优化(optimizing e-commerce)领域。这个领域已经存在有一个完整的行业生态,业内的顾问、专家和公司专注于围绕产品标题和描述做搜索引擎优化(SEO),还有亚马逊登录页面的转换率优化等。现在这些专业知识正在转化为模型工具,能自动进行测试与优化,用 LLM 就可以运行,为客户带来实质经济效益,很多还能与人力团队竞争,这很有意思,因为六到九个月之前这个市场都是基本空白的。而在我刚才提到的每个细分领域中,几乎都有一家公司正在或即将通过提供产品/服务获得千万级别的收入。
还有一些法律科技公司正在利用 LLM 替代或增强律师助理的工作,例如 Harvey、Robin 和 Spellbook 等。他们能完全取代律师吗?当然不能,但在一定程度上,这些工具能快速高效地完成律师需要花大量时间完成的机械性工作。
医疗环境中的临床信息记录也可以和 LLM 结合起来。
企业成功的秘诀一直在于软件和人员的有机组合,但随着 LLM 带来的软件能力的提升,软件可以接手的工作量在增加。这使得企业在朝着一种“cybernetic”方式发展,即人与机器在工作流程中的有机融合,LLM 和企业工作流的融合是不可逆的。
「往期推荐」

END
欢迎全国各地以及境外科技产业及金融精英,寻找优质项目、资金及获得全球顶级金融圈层请联系Cathy,或者在菜单中点击【青投服务】——>【服务登记】,留下您的需求我们将竭诚为您服务。
「青投创新」
青投创新,新型科创产业服务平台,以科技、人才、资本为核心,通过内容出版、数据支持、产业咨询、科技转化等业务,为科技人才创业项目提供孵化及加速赋能服务,助力国家科技兴国计划。
「青年投资家俱乐部」
青年投资家俱乐部汇聚来自金融机构、政府机构、上市公司、产业公司、三方服务的数万名专家资源。
继续阅读
阅读原文