ChatGPT 之父最新专访：发现 GPT-4o 惊喜用途，下一代模型可能不是 GPT-5

GPT-4o 的发布又一次惊艳了全世界

，而 Ilya 的辞职也引起了热议，甚至是被视为一个时代的结束。

就在 Ilya 辞职之前，有着「ChatGPT 之父」称号的 OpenAI 的联合创始人兼首席执行官 Sam Altman 接受了专访。

访谈中，Sam 从 GPT-4o 的使用体验，到 GPT-5 出现的时机与新形式，以及 AI 为企业和个人带来的机会，为我们揭示了不少发布会的幕后细节，对人工智能助理的前景表达了自己的兴奋和忧虑。

原视频链接：

https://www.youtube.com/watch?v=fMtbrKhXMWc&ab\_channel=TheLoganBartlettShow

以下是采访全文：

GPT-4o 让我爱不释手

Logan：欢迎来到《Logan Show》，这是一档与科技领域领导者和投资者对谈的节目。本期你将听到我与 OpenAI 的联合创始人兼首席执行官 Sam Altman 的对话。

我们将会深入探讨与近期非常热门的人工智能相关的多个话题，以及 OpenAI 的发展方向，还有 Sam 对于 AI 这一前沿领域的看法。

Logan：好的，让我们从轻松的问题开始。在执掌 OpenAI 的过去四五年间，你生活中发生的最大改变是什么？有没有什么不同寻常的改变呢？

Sam：发生了很多，其中最奇怪的就是我无法再在公共场合当个「小透明」。如果之前听到这种话，我可能只会觉得「好吧，是有点奇怪」，实际上它比想象中更奇怪，这是一种很奇特的孤立的生活状态。

Logan：你曾经非常坚信人工智能和商业的力量，那么你难道没有想过执掌这样一个公司可能带来的连锁反应吗？

Sam：我没想到很多事情，比如公司会成为一个非常有影响力的公司，更没想到仅仅是在自己的城市出去吃个晚饭都会变得如此困难，这真的很奇怪。

Logan：不久前，你刚发布了多模态模型 GPT-4o。它可以跨越文本、语音和视觉工作，你能解释一下多模态的突破为什么很重要吗？

Sam：因为我认为多模态的方式是使用计算机的一种革命性的飞跃。实际上，我们很久以前就有了语音控制计算机的想法。你知道的，我们有 Siri，之前还有其他类似的技术，但它们从来没有让我感觉到使用起来很自然。

但 GPT-4o 这个技术，由于多方面因素的结合——它的功能、速度、增加的多模态支持、语调的自然性等——让使用体验大大提升。你可以轻松地调整说话速度或改变声音，它的流畅性和灵活性让我非常喜欢。

Logan：Spike jonze（电影《Her》的导演）会对它感兴趣哈哈。有没有什么特定的使用场景吸引了你？

Sam：嗯，虽然我才用了一周左右，但有个特别惊喜的用途是：在我全神贯注工作时，将手机放在桌子上。然后在不需要切换窗口或停下我的工作，就能够将 GPT-4o 作为一个新的信息渠道。这样我就不需要打断我的工作流，就可以询问它并得到答案，这很不错。

Logan：那么，这一切的背后是架构上的变革还是更多的算力？

Sam：其实这就是我们在过去几年间在研究中的积累，我们一直在研究音频模型，我们一直在研究视觉模型，我们也一直在尝试把它们结合起来，我们还一直在寻找更高效地训练模型的方法。这并不是说我们发现了某个革命性的新技术，而是所有这些的结合。一次性把所有技术拼凑在一起确实不简单。

Logan：考虑到延迟的问题，你觉得是否需要开发一种在设备上运行的模型，以减少延迟，达到实用性所需的水平？

Sam：对于视频来说，处理网络延迟可能会成为一个难题。我一直对 AR 眼镜这种能实时与世界交流、感知事物变化的东西情有独钟，但网络延迟可能会让这变得很困难。不过，两到三百毫秒的延迟，人会感觉非常快，在很多情况下这个延迟比人类的响应速度更快。

Logan：好的，你最近提到了下一次的大型发布活动可能不会是 ChatGPT 5。似乎有一种迭代式的模型开发方法正在被你们采用。我们可以这样理解吗？

Sam：未来发布的大模型可能不会是一个标志性的大版本，如 GPT-5，我确信我了解到的一点是，AI 和惊喜不是很搭。虽然，你知道科技公司通常遵循发布产品的传统方式，但我们可能应该采取不同的策略。

现在，我们仍然可以称它为 ChatGPT 5，并以不同的方式发布，或者我们可以考虑其他名称，但我认为我们还在摸索如何为这些东西命名和定位。我觉得以 GPT-1 到 GPT-4 这样的命名是合理的，但现在很明显 GPT-4 已经有了很大进步。

我们也有这样的设想，可能会有一种潜在的像是「虚拟大脑」一样的基础模型，在某些情况下，它可能比其他情况进行更深入的思考，或者可能是探索不同的模式，但用户也许并不在意它们是否存在差异，我认为我们还不知道如何让这些产品在市场受到青睐。

Logan：这是否意味着，计算在模型上取得增量进展的需求可能比以往要少？

Sam：我更倾向于认为，我们会尽可能地利用我们能获得的所有计算资源。我们现在正在取得难以置信的效率提升，这非常重要。

你知道，今天我们发布的一个很酷的功能显然是语音模式，但或许最重要的是我们做到了如此高效，以至于我们能够向免费用户提供服务，达到世界顶尖的水准。

任何想免费下载 ChatGPT 的人都可以得到它，而且它相对于 GP4 和 GP4 Turbo 在某些场景有了显著的效率提升。我们在这方面还有很多进步的空间。

当我们从几十年后回望，会说：「某些事情改变了」

Logan：我听说你提到过 ChatGPT 实际上并没有真正改变世界，但可能只是改变了人们对世界的期待。

Sam：是的，我不认为你可以从任何经济指标中找到太多证据表明 ChatGPT 真的影响了生产力或其他领域，或许客户支持或某些特定领域是例外。但如果你查看全球 GDP，你能发现 ChatGPT 发布的影响吗？恐怕不行。

Logan：会不会存在一个我们可以明确地看到 GDP 增长的时间节点？

Sam：我不确定是否能够说这是因为某一个模型的影响，但我认为如果我们从几十年后回望，会说：「嗯，某件事情改变了。」

Logan：在接下来的 12 个月里，我认为哪些应用或领域最有前景？

Sam：我可能会因为所在领域的限制，存有一些偏颇，但我认为编程是一个非常重要的领域。

Logan：关于「惨痛教训」，你最近也花了一些时间进行讨论。你曾详细讨论了深度专业化模型与通用模型的主要区别在于，专业化模型是为了特定的数据和目的训练的，而通用模型则具备真正的推理能力。

Sam：我相信，未来真正有影响力的将是通用模型。如果一个能进行通用推理的模型发现新事物，那么当需要处理新类型的数据时，我们只需提供新的数据，它就能够适应并处理。但专业化模型在这方面是不可能的。

我认为许多专业化模型组合在一起，也无法进行通用推理。所以，编写特定模型的重点可能在于，我认为我们最应该弄清楚的是真正的推理能力，然后我们可以将其应用于各种场景。

自然语言是人和 AI 之间很好的交流方式

Logan：你认为未来两年内人类与 AI 之间的主要交流方式将是什么？

Sam：自然语言似乎是一个很好的选择。我对这个想法很感兴趣，那就是我们应该设计一个人类和 AI 可以共同使用的未来机制。我对类人机器人比其他类型的机器人更感兴趣，因为我觉得现在的世界是为人类设计的，我不想让它为了某种更高效的模式而被重新设计。

我喜欢这样一个想法，即我们用非常适合人类的语言与 AI 交流，它们甚至也可以用这种方式相互交流，这个想法可能还有待探索。尽管无法预知未来，但我认为这是一个值得推动的有趣方向。

Logan：你最近提到，随着时间的推移，模型可能会变得越来越走向大众，但最重要的可能会是关于模型的个性化，我理解你的意思了吗？

Sam：我不是很确定，但我觉得这听起来很有道理。

Logan：那么，除了个性化，你认为最终对用户而言，普通的商业用户界面和易用性最终会成为胜出的关键吗？

Sam：这些因素当然很重要，它们总是如此。我可以想象还有其他因素，但我认为，常规的商业规则仍然适用。

每当出现新技术时，我们总是很容易认为旧规则不再适用，但这种想法通常是错误的，传统的创造和流失价值的方式如今仍然很重要。

Logan：当你看到开源模型开始追上基准标准的时候，你怎么想？

Sam：我觉得这非常好。我认为，就像其他技术一样，开源将有其一席之地，托管模型也是如此，这很好。我不会询问任何具体的细节，但已经有媒体报道关于筹集大量资金的消息。华尔街日报是其中一个可信的报道来源，这些资金是为了在半导体行业激励投资。像台积电和 Nvidia 这样的公司一直在积极扩张，以满足对 AI 基础设施的期望。

Logan：你最近说过你认为世界需要远超目前水平的更多 AI 基础设施。那么，你是不是观察到需求端有些什么需要比我们目前从台积电和 Nvidia 获得的更多的 AI 基础设施？

Sam：所以首先，我有信心我们会找到方法降低现有系统的成本。其次，随着成本的降低，人工智能系统的需求必然激增。我相信，通过打造更大更强的系统，需求将会进一步飙升。

我们都应该期待一个智能资源廉价到不需计价的世界，在那里，智慧资源丰富到人们可以随意使用，甚至不用考虑太多。比如说，我是希望它帮我阅读回复所有邮件，还是用来治疗癌症？当然，治愈癌症更重要，但理想情况是两者都能实现。我关注的是确保我们拥有足够的资源，让每个人都能享受到智能技术带来的益处。

Logan：我想请教你对于Humane、Limitless等公司推出的不同物理设备助手有何看法？你认为它们有哪些不足之处，或者为何它们的普及程度尚未达到预期的用户需求？

Sam：我认为它们都太早期了。我一直是多种计算设备的早期用户，有着丰富的使用体验。我曾经拥有并非常喜欢 Compaq TC1000，觉得它超酷，那是我大学新生时期的事了，它与 iPad 相比还有很长的路要走，但方向是对的。

后来我又用上了 Treo，我用的是老款的 Palm Treo，那时候孩子们并不会拥有它，而它与 iPhone 相比也有很长的距离。但最终我们还是实现了。这些设备似乎朝着一个非常有前景的方向发展，只是还需要一些时间的打磨和技术的迭代。

适应 AI 进步：建立有长期竞争力的企业

Logan：你最近提到，很多在 GPT-4 上构建的业务在未来将会被更先进的 GPT 技术「碾压（steamrolled）」。你能详细解释一下这个观点吗？谈到 AI 领域的企业特点，哪些企业能在 GPT 的不断进步中生存下来？

Sam：我发现的有效方法是，在构建业务时，你其实是在做两种选择：要么赌下一代模型不会太出色，要么就是赌模型会更进一步，并从中受益。

举个例子，如果你投入大量努力，仅仅是为了让某个应用案例勉强可以运作，这个应用案例恰好是 GPT-4 所不能处理的。然后当你终于成功时，但后来 GPT-5 出现了，并且它能够更出色地完成这个任务以及其他任务，那么你之前为那个单一案例所做的努力可能就会感到有些尴尬了。

但如果你有一个产品，在各个方面都表现得还不错，人们自然会去使用它，而你并没有投入大量精力去实现某个特定功能，然后 GPT-5 或者其他名称的模型出现了，表现得更好，你就会享受到「水涨船高（the rising tide lift at all your boats effect.）」的影响。

我想说的是，大多数情况下你不是在创建一个 AI 企业，而是在创建一个业务，AI 只是你采用的一种技术。在应用商店的早期阶段，有很多产品填补了某些明显的空缺，但随后苹果解决了这个问题，我们现在已经不再关注应用商店里的手电筒应用，因为它们的功能已被集成到操作系统中。这将是未来人工智能业务可能的发展方向。

然后有些应用，比如 Uber，它们虽然是由智能手机的普及带动的，但实际上它建立了一个非常稳固且长期可行的业务模式，我认为这正是我们应该追求的方向。

Logan：我明白你的意思，而且我能想象出很多应用你们技术理念的企业，它们在某种程度上都符合这一框架。那么，你能否给出一个具体的例子或新型概念，它符合我们之前讨论的模式？例如，Uber这样的公司，它不必是一个真实存在的企业，即使是一个假设性的公司、一个玩具概念，或者只是你认为以这种方式实现的某个想法也可以。

Sam：我更倾向于押注那些新兴的初创企业，一个典型例子是，当人们尝试创建类似于人工智能医生的人工智能诊断工具，人们常说，「我不想在这个领域创业，因为像梅奥诊所（Mayo Clinic）等知名机构肯定会做这件事」，但我更倾向于认为会有新公司涌现出来做这样的事情。

Logan：对于那些想要主动准备迎接这些巨大变革的 CEO，你有何建议？

Sam：我敢打赌，智能作为一种服务，每年都在变得越来越好、越来越便宜，这是取得胜利的必要条件，但并不足以让你取胜。大公司虽然需要时间来做到这一点，你可以借此优势超越它们，但同样意识到这一点的其他创业公司也会这么做。

所以你需要搞清楚让你的业务长期保持竞争力的策略。现在的竞争环境比往常都要开放，有许多令人兴奋的新事物等着去做，但这并不意味着你可以忽视打造核心价值这一艰苦的过程，尽管现在有更多种方式可以实现。

Logan：鉴于人工智能的飞速发展，你能否预测在未来五年内可能涌现或成为主流的新职位类型？这些职位可能是当前鲜为人知或尚未存在的。

Sam：这是一个很棒的问题，我以前从未被问及过。人们总是问，什么工作会消失，但提问新工作更加有趣。让我想可能有1亿或5千万人可能会涉足的新领域。这可能涉及全新的艺术形式、娱乐方式，以及更加注重人与人之间的联系。

虽然我不知道这些职位的具体名称，也无法确定我们是否能在五年内达到这样的规模，但我认为面对面的体验将会变得非常珍贵，可能会形成一个新兴的巨大市场。

我们可能会见证断崖式的技术飞跃

Logan：OpenAI 最新的公开融资估值大约是 900 亿美元。除了 AGI，你认为还有哪些里程碑能让 OpenAI 成为一个万亿美元的公司？

Sam：我相信如果我们能持续以目前的速度改进技术，并且继续开发出好产品，收入也会继续增长。我不确定具体的数字，但我认为我们的前景是光明的。

至于目前的商业盈利模式是否能创造 1 万亿美元的股权价值，订阅模式对我们来说很有效。虽然我原本对此并不抱有太大期望，但结果却相当不错。

Logan：至于 OpenAI 目前的结构，虽然不想老调重弹，但你提到了途中的一些改变，你认为未来更适当的结构是什么？

Sam：我认为我们已经准备好了讨论这个问题，我们一直在积极探讨和头脑风暴。我希望在今年内，我们能够就此进行更深入的交流。

Logan：嗯，一个有趣的点是，关于人工智能的既定印象，有一个特别有趣的话题是你的货币化模型观点。我们曾听你提及，首先是取代体力劳动，然后是白领工作，最后是创意工作。

但显然，事情与预期完全相反。是否有其他出乎意料之外的事情呢？比如，我本以为会是这样，但实际上却是完全相反的情况。

Sam：这对我来说确实是一个巨大的意外。除了你提到的那一点，还有其他一些事情，比如我没想到人工智能会如此擅长法律工作，并且会这么早就展现出这样的能力。因为我一直认为法律工作是非常精确和复杂的。

Logan：对于那些还没有听你讲过 AGI，以及你为什么不喜欢这个术语，你能详细解释一下你的观点吗？

Sam：因为我知道AGI不再是一个明确的时间点。显然，当你创办一家公司时，你会有很多天真的想法，特别是在这样一个快速发展的领域。OpenAI成立之初，我也曾天真地认为，我们将从没有AGI的时代开始，然后实现AGI，这将是一个真正的飞跃。

我仍然认为可能会有一些突然出现的飞跃式发展，但总的来说，我认为它还是会像一个持续增长的曲线一样呈现波动上升的趋势，关键是进步的速度。你和我可能不会在具体的月份或年份上达成一致，到那时我们会说好吧，现在这就是通用人工智能了。我们可以设计其他测试，我们或许会对此达成共识，但是即使这样，事情比表面上看起来要困难得多。

你知道，当前的 GPT-4 显然还没达到普遍意义上的 AGI水平，我也不觉得我们下一个大型模型会达到。但我可以想象，我们可能只差一两个创新的想法，再加上一些规模扩展，就能创造出一些让我们觉得真的不一样的东西。我认为，对此保持警觉是很重要的。

Logan：是否有更现代的类似图灵测试，我们可以称之为巴特利特测试呢？

Sam：当它达到某个阈值时，我认为，如果它能够进行比所有 OpenAI 研究人员甚至是一个 OpenAI 研究人员更优秀的研究，那将是一个非常重要的标志。但这样的进展是否即将到来，目前还不太确定，但我不会完全排除这种可能性。

Logan：你认为达成 AGI 的最大的挑战是什么？听起来你认为目前的规模化原则可能还行得通，至少在接下来几年内是这样。

Sam：是的，我认为最大的障碍是需要新的研究。你知道，我从互联网软件转向 AI 的过程中不得不学到，研究并不像工程那样有固定的进度表。这通常意味着它需要更长的时间，并且不总是有效，但有时候它的进展速度却又远超任何人的预期。

Logan：能不能详细解释一下，为什么它的进展不是线性的呢？

Sam：我想，通过历史例子来解释可能是最好的方式。

嗯，我记得中子最初是在 20 世纪初被理论化，大概在 20 年代首次被探测到，关于原子弹的研究始于 30 年代，并在 40 年代取得了成果。

从几乎没有任何关于种子的理论概念，到能够制造出原子弹，甚至彻底动摇我们对物理学的直觉，这样的速度简直令人震惊。

还有一些不那么纯粹属于科学的例子，例如关于莱特兄弟曾在在 1906 年他们认为人类飞行还要 50 年，然后在 1908 年他们就实现了飞行，类似的例子在科学和工程领域比比皆是。

当然，也有很多我们预测的事情从未发生，或者比我们预期的要花费数十甚至数百年的时间更久。但有时候，进步确实是突飞猛进。

Logan：关于可解释性，我们目前在这一领域处于怎样的位置？它对人工智能的长期发展有多关键？

Sam：可解释性有不同的层次，包括我是否理解网络在机械层面上的每一层运作方式，或者我是否能够通过查看输出来指出其中存在的逻辑错误。我对OpenAI以及其他机构在可解释性方面的研究充满期待。我认为，作为一个更广泛的领域，可解释性具有巨大的潜力和令人兴奋的前景。

Logan：我不会催你，但我想你们在准备好要宣布什么的时候，会有一个精彩的公告。这里还有几个问题，随着人们对AGI的期待日益高涨，关于OpenAI等组织单方面利用其并做出决策的担忧也在增加。这促使一些政府机构介入，希望由选举产生的领导者来做出这些决策，而非完全依赖OpenAI等公司。

Sam：是的，我认为对于像我这样的人来说，严格规范现有模型能力将是个错误。但当模型对世界构成重大的灾难性风险时，我认为实行某种监督措施可能是件好事。

目前，如何设定这些风险的阈值以及如何有效测试它们，我们确实还仔细权衡。如果因为过度担忧潜在风险而限制了这项技术的巨大优势，让那些希望在自家地下室训练模型的人望而却步，那将是一个巨大的损失。

但话说回来，如果我们用国际核武器规则作为参照，我认为对人工智能进行某种形式的监管是合理的。

Logan：嗯，你认为他们没有看到人工智能中潜在的风险吗？

Sam：我认为他们就是没有整体上认真考虑过 AGI。但我确实同情他们的立场，像看看欧洲的技术产业发生了什么，我理解，我真的理解。然而，我认为有一条我们正在接近的界限，超过这个界限，我们可能都会有不同的感受。

Logan：你认为开源模型本身就存在固有的危险吗？

Sam：目前没有哪个模型是这样，但我可以想象将来可能会有。

Logan：我听你说过，安全在某种程度上被当作了一种错误的框架，因为它更多地关注我们明确接受什么。

Sam：确实如此，这并不是一个非黑即白的事，就好比你愿意坐飞机，因为你觉得它们相对安全，尽管你知道它们偶尔会出事。那么关于什么样的航空公司才算安全，这个问题有许多讨论，每个人的看法都不尽相同，这是个当前的热门话题。

航空业已经变得极其安全，但安全并不意味着绝对没有人在飞机上丧生。同样，医学领域我们也非常重视副作用，因为有些人会对药物产生不良反应。此外，安全还有其隐性的一面，比如社交媒体可能带来的负面影响。

Logan：你能想象在什么情况下，你会在安全范畴上做出与推进相反的决策呢？

Sam：我们有一个叫做「准备框架」的东西，就是为了针对这些，也就是在特定的类别和层面上，我们的行动策略会有所不同，以应对潜在的风险和挑战。

Logan：考虑到众多快速涌现的应用场景，我认为我们当前面临的一个主要瓶颈是人工智能基础设施的不足。假设有研究人员对现有的神经架构Transformer进行了某种突破性的改进，使得所需的数据量和硬件大幅减少，甚至接近人脑的水平，那么你认为这是否会加速「技术飞跃」？

Sam：当然，这是有可能的，并且可能不需要任何修改。虽然我认为这并不是最有可能发生的情况，但我并不完全排除这种可能性，重要的是，我们要在可能发生的各种情况中考虑到这一点。

我认为，即使技术发展在加速，这个过程也会是渐进的。我不认为我们可能某天睡觉时还处在初步的人工智能阶段，然后第二天醒来就面对真正的超级智能。但即使技术突飞猛进仅发生在一年或几年之内，那也算是相当快速了。

另一个要考虑的是，即使我们拥有了真正强大的AGI，它在短期内对社会的影响也是有限的。我猜测，大多数情况下，它不会在一年或两年内产生足够大的影响，但在十年内，世界绝对会发生巨大的变化。在这方面，社会的惯性实际上可能是一个积极的因素。

多年后，人类仍然会关心其他人类

Logan：嗯，你追求AGI的动机是什么？抛开股权不谈，即使我相信大多数人都会觉得，即使他们追求的是更高的使命，得到相应的报酬也会是一种安慰。那么，你每天来工作的动力是什么？你又从哪里获得最大的满足感？

Sam：我一直对人们说，我现在愿意做很多其他生活上的调整和牺牲，因为我认为这是我将会接触到的最激动人心、最重要、最好的事情，这是一个充满变革的时代，我很高兴这不会永远持续下去。

你知道，将来某天我可以退休去农场，我会怀念这段时光，但会想，哦，那些是压力很大、非常漫长的日子。但这也是非常酷的，我简直不敢相信这些事情真的发生在我身上，这就像是不可思议的奇迹。

Logan：我们回到那个你因名气而不能在自己城市出门的例子，是否有过一个最超现实的瞬间，那种让你惊叹：「哦，天哪」的瞬间？让你感到仿佛置身于一个超现实的场景之中？

Sam：每天都会有一些事情让我惊叹。比如那个星期（去年11月份被董事会罢免），我收到了来自世界上一些重要人物，如总统、国家总理等的10到20条短信，但这并不是让我感到奇怪的部分。让我感到真正奇怪的是，当这一切发生时，我像是在正常地回应他们，发送“谢谢”之类的信息，感觉一切都非常自然。

我们度过了那四天半疯狂而紧张的时光，我几乎没有睡觉，也没有怎么吃东西，但我的精神却出奇地好，头脑清晰，极度专注。

几乎每天都有那么一些事情，让你惊叹，如果我能稍微腾出一些心思去回想，这就会觉得太疯狂了。有点像鱼儿在水里的感觉，但是，是的，就是那种效果。

Logan：所以，当你想到模型变得越来越智能，你之前稍微提到的那样，关于创造性方面，在你看来，随着人类和大模型开始承担更多过去仅由人类完成的任务，哪些特质或能力仍将是人类所独有的呢？

Sam：我相信，即使很多年之后，人类仍然会关心其他人类。

我在网上稍微搜了一下，大家都在说，「哦，现在大家都会爱上 ChatGPT 了」，大家都会谈论 ChatGPT 女友什么的。我敢打赌不会，我认为我们内心深处非常关心其他人，无论是大事小情，以各种不同的方式，这种对人的关心将会持续存在，我们对他人的关心几乎可以说是一种固有的执着。

虽然你可能听说过许多关于人工智能，但我想不必在意，毕竟我们不会把观看机器人踢足球当作主要的娱乐爱好。

人和 AI 助手的分离是有价值的

Logan：当你管理 OpenAI 公司时，你在制定了很多运营企业的规则或框架，然后你同样打破了许多规则。OpenAI 是否引入了不同类型的高管？或者你是根据不同的特质来招聘的？

Sam：我通常并不倾向于从外部聘请高管，但我认为，如果公司总是仅从内部提拔高管，可能会导致公司文化的单一化。我认为公司需要引入一些新的高级人才来注入活力。但在这里，我们主要还是依赖本土人才，考虑到我们所做的与其他地方的工作很不同，我认为这是一件好事。

Logan：在 OpenAI 的发展过程中，有没有一个决策在你做出的时候感觉特别重要？

Sam：很难只指出一个，或许有一个就是：我们决定采用所谓的迭代部署策略，也就是我们不会秘密地构建 AGI 然后一次性发布到世界上，这是过去的普遍看法，这是当时许多公司和人们的普遍观点和计划。但我认为这个决定非常关键，而且在当时看来确实非常重要。

Logan：关于押注语言模型的背后故事我一直很好奇，这一决策是如何产生的？

Sam：嗯，当时我们团队正专注于多个项目，包括机器人开发和视频游戏。然而，在这个多元化的背景下，一个相对较小但充满热情的团队开始投身于语言建模的研究。伊利亚（Ilya Sutskever，OpenAI前首席科学家）对此方向深信不疑，他坚信语言模型的发展潜力，最终成了我们专注的语言模型。

于是，我们着手进行 GPT-1 的开发，接着是 GPT-2，我们深入研究了缩放定律，进而升级到了 GPT-3，然后我们做出了重大决策，决定将作为我们的主攻方向。尽管事后看这些决策似乎显而易见，但在当时，确实是一个经过深思熟虑的决策。

Logan：你最近提到了关于 AI 的两种不同方法：复制自己和打造最聪明的雇员。

Sam：这并不是关于 AI 本身，而是关于你想如何使用 AI，当你想象使用你的个人 AI 时。

Logan：能否请你进一步详细解释呢？因为我认为这对你关于未来人工智能用例的思考具有深远的影响，你能再次解释一下那个观点吗？

Sam：当然。当我在未来五年内收到你的短信时，我希望能够清楚地知道，这是你直接发给我的，还是由你的人工智能助手代为转发的。

我认为保持人和 AI 助手的分离是有价值的，AI 助手也不能简单地认为完全是人的延伸。对我来说，我不想感觉这个东西只是我身上的一个奇异附属物，而是一个可以跨越障碍与我沟通的独立实体。

你在音乐或创意领域就能看到这一点，复制德雷克或泰勒·斯威夫特的音频变得很容易，因为我们可能需要某种验证机制或系统来确认，这确实是某个人的创意作品，个人层面大概也是如此。

当我们思考教育体系，想象一下 2030 年或 2035 年的大学新生，或者未来的某个群体，大学教育体制中应该做出哪些具体改变来为未来做好准备，我认为最重要的一点是，学生不仅应该被允许使用，而且应该被要求使用。

在使用这些工具时，有时候我们更倾向于让人们采取传统方式行事，因为这样有助于加深理解。

我还记得在数学课上，有些时候你不能在考试中使用计算器。但实际上，在现实生活中，你是可以使用计算器的，因此你需要理解它的原理，并且要能熟练操作计算器。如果你在数学课上从没用过计算器，那你在以后的工作中会遇到困难。

如果 OpenAI 的研究人员都不使用计算器，那么 OpenAI 可能至少在计算机方面不会取得如今的成就。我们不会教导人们不使用计算器或电脑，同样，我认为我们也不应该训练人们不使用 AI。AI 将成为未来从事有价值工作的重要组成部分。

Logan：最后，在规划通用人工智能（AGI）及其未来时，你曾写道第一个 AGI 只是智能连续体上的一个节点，我们之前讨论过这个话题。

Sam：我们认为，从那一点开始，进步可能会持续，未来很长一段时间内可能会保持过去十年的发展速度。

Logan：那你是否曾经私下停下来思考未来会是什么样子？或者是否它太过抽象，以至于已经无法具体描绘了？

Sam：我一直在思考。但我不是说我能想象出有飞行汽车的《星球大战》式未来城市场景，但我确实在思考，当一个人能够完成数百上千个协作无间的人的工作时，这意味着什么？当我们能够探索到所有科学领域时，那会是什么感觉？肯定非常酷。

Logan：是的。Sam，感谢你接受这次访谈。

继续阅读

阅读原文

关键词

模型

公司

GPT-4

人工智能

技术