大语言模型时代，AI和人类谁更懂你？

ChatGPT 与其之后不断涌现的大语言模型（LLM）迅速席卷了整个时代。随着计算机对人类自然语言的领悟程度突飞猛进，我们与计算机的交互方式正在迅速而深刻地改变着，这也即将带来一场既广泛又具有极强创新性的商业模式转型。

近日，真格基金管理合伙人戴雨森与拾象科技进行了一场对谈，以投资人的角度切入，话题从大语言模型技术漫谈开去，经由商业应用与 OpenAI 带来的启发，一直讨论到 AI 与人类交互的哲学思考。

以下是他们的讨论提要：

关键判断——LLM 的价值以及能力边界，操作系统和大模型之间的差别，LLM 带来的变化
应用思考——AI Native 的应用应该是怎样，「创新者的窘境」，科技巨头如何将 LLM 与业务结合
OpenAI 组织架构——AGI 信仰，自下而上的创新，强技术与敏锐商业的结合
哲学思考——什么知识应该被公有化；拥有超级助理的未来，到底 AI 和人谁能更懂你

相信这次对谈不仅会对投资人和创业者有所启发，所有关注科技变革与商业的求知者，都能从中获得不同的视角与新的收获。如果这篇文章也让你产生了表达欲，欢迎在评论区和我们交流～

大语言模型关键判断

底层模型的价值和能力边界是什么？

拾象广密：

就像 Windows 一样，当年微软往上做了 IE 浏览器、Office、MSN。目前模型的能力和边界还不明确，但它也会持续往上做，未来可能会拿走整个价值链大头。以前企业内有 ERP、HR SaaS 等等，未来可能会出现“大模型+周边多个小模型”共存的模式。

Yusen:

那么，你认为能力主要还是在模型端体现，模型端会承担 heavy lifting 的工作，应用端更多是一个输入输出（IO）或者是界面（Interface）的角色吗？

拾象广密：

我认为模型只是大脑的提供者，如果要应用的话，还需要看其他方面，比如是否在垂直领域积累了很强的专有数据、形成了网络效应等。

Yusen：

你的观点是，为了维护应用的竞争力，必须拥有大量模型之外的资产来捍卫能力端，否则应用可能会被模型所取代，对吗？

拾象广密：

是的。我们在早期投资应用，应该思考清楚模型的边界是什么，哪些应用不会被碾压。我们认为：有专有数据的、有网络效应的、有规模效应的，以及涉及机器人等硬件的，不容易被大模型取代。大家可以关注这几类公司：1）在硬件机器人，尤其是消费级机器人领域有提前布局的，可以使用新 AI 技术让机器人使用体验变得更好的；2）能持续积累独特数据的；3）有网络效应的，即大模型能不能再造一个微信、陌陌。

Yusen：

没错。因为目前 ChatGPT 只能解决相对普遍的问题，很难应对更细致且精确的问题。但是在工作中往往需要更精确的答案。尽管 AGI 非常强大，但其仍存在局限性，例如可能无法构建类似于微信的熟人网络。大型模型面临着难以逾越的层级障碍。这是大型模型的内在问题，可能需要技术突破来解决。与互联网不同，AI 存在许多层级，但跨越这些层级并非自然而然的过程。

图源：拾象科技

操作系统和大模型之间的差别是什么？

Yusen：

Windows 操作系统形成当前格局的过程中，伴随着很多开发壁垒，开发者需要与特定平台绑定，以产生强大的网络效应。大模型目前还没有出现类似现象。

拾象广密：

是的，其实大模型的迁移成本没有操作系统高。

Yusen：

对。因为操作系统竞争的核心在于用户分布在哪个系统上，为了吸引用户，开发者需要针对 Windows 开发应用。与此相反，基于浏览器的应用可以通过任何浏览器获得用户。这方面更类似于公有云，因为应用程序可以在任何云平台上运行，无需关注底层基础设施。

拾象广密：

是的。还有一个和 Windows 的区别是，操作系统和应用之间的数据不互通，而模型和应用之间迭代性更强，黏性也更强。而且，应用的爆发对模型迭代是很有帮助的。

LLM 究竟带来了什么变化？

拾象广密：

第一，可以让我们采集更多非结构化数据。大语言模型能把我们说的所有话转化成各类数据。未来人类和企业的行为将会为模型提供更多数据沉淀，存入企业的数据库，用来做更多分析；

Yusen：

原来采集的数据得经过大量的人工清洗才能使用。现在只要把数据放进去，模型自己就能理解。

拾象广密：

第二，交互方式的多元化、简洁化。ChatGPT 目前还是用文字对话，未来可能会有语音对话，甚至用手拖拽、滑动。在内容形式上，除了文字，还有可能返回图片、视频等其他各种形式的内容。

Yusen：

ChatGPT 很像一个助理。以前的交互是用户教计算机做事情，现在不用教，它自己就可以学习、做事。比如我说“我渴了”或“我想买张机票”，以前是菜单操作，但未来它也许可以自己搞定。交互会变得越来越简单，它的做事能力也会越来越强。一些高维度、复合型的事情交给 AI 来做会更好。

图源：拾象科技

大语言模型应用层思考

AI Native 的应用应该是什么样？

拾象痕痕：

AI native 应用究竟是什么？其核心特点在于，它并非仅仅将现有模型简单地嵌入应用中。无论是面向消费者（ToC）还是面向企业（ToB）的软件和服务，AI native 应用必定会对它们进行深度重构。

第一是交互的重构：新产品可以使用大语言模型的理解能力，通过多轮对话去适应用户，了解用户需求，提供更灵活的输入方式。
第二是数据和信息的重构：如果数据是石油的话，现在炼油的能力变强了，能炼出来的价值也就更多了。
第三是服务的重构：一是大模型可以直接提供服务，替代具有撮合作用的服务；二是让交易的决策和的发生链路变短，提供直接交易的可能性。
第四是反馈机制的重构：在过去，主要是产品功能在不断迭代，而现在则是模型在持续演进。用户可以通过提示（prompt）过程对错误进行纠正，同时也可以通过大量数据对模型进行重新训练。据说 GPT 模型现在已经实现了每周一次的迭代。

Yusen：

从我听到的信息来看，AI native 应用对软件和服务的重构过程中体现出几个很明显的能力。

首先，AI 在非结构化数据的收集和复用方面具有非常强大的能力。过去，可能只有不到 1% 的信息能够被收集、整理并复用，而如今可收集和复用的数据大幅增加。
其次，直接生成是 AI 最显著的能力。
第三，互联网原生应用的产生是基于每个人都大量使用互联网。当前，我们正处于人人使用 AI 的初级阶段，当每个人都拥有 100 个 AI 助理时，这些AI 助理将扮演何种角色？我们尚未看到那时产品的形态。

此外，在中国，公有大模型的私有化部署问题尤为重要。一个人对大语言模型的输入可能会直接转化为其他人的能力。

拾象广密：

这是一个很大的问题，私有部署之后，模型迭代的速度是慢于开源和 OpenAI 的。私有部署的模型能力很强之后，竞争对手可能会基于更强的模型做部署者本来的业务。

图源：拾象科技

「创新者的窘境」

拾象广密：

在大模型的发展下，未来的应用服务供给可能会发生较大变化。应用提供商不再基于安卓、iOS 开发应用，而是直接把供给通过某种形式对接给 AI 助理们。

Yusen：

这是典型的“创新者的窘境”。如果用户首选 ChatGPT，应用构建者则需在 ChatGPT 内部开发。但是，如果我是应用负责人，我不愿为 OpenAI 提供便利，因为这将影响我的核心业务。然而，如果不适应 ChatGPT 并在其中寻找商业模式，我的应用可能会被淘汰。

拾象广密：

是的，以美团为例，它如果很想做出一个生活助理，但又不愿被 Siri 这样的超级助理取代。这就引发了关于人们需要多少个助理的讨论。

Yusen：

所以这是一个高频打低频的终极答案？

拾象广密：

有可能。如果高频打低频是成立的，那其实对低频助理是很不利的。到时候 OpenAI 有可能会把虚拟世界的助理取代掉，因为它会把 APP、 SaaS 系统重新组合。所以谁能走在流量前端才是更重要的。

Yusen：

最有可能的情况是，凭借 ChatGPT，OpenAI 能够在竞争中脱颖而出。或许 ChatGPT 可以同时调用多个接口，实现跨应用整合。然而，这需要一个开放的生态环境。各方愿意分享对整个系统最有利，但同时也不能忽视各方可能再次建立壁垒、设置障碍的风险。

科技巨头如何将 LLM 与业务结合？

拾象程天一：

目前的二级市场上市科技公司、科技独角兽在和 LLM 结合中找的场景，可以大体分为四类：

第一，作为内部提效工具，降低成本。
第二，与现有业务场景自然结合大多数公司都属于这一类。通过不断测试场景，最后挑出来 10-20 个比较好的，再选择 4-5 重点去做。
第三，作为重点业务抓手，突破过去比较难做的业务。
第四，作为公司战略抓手，获得新的战略增长点。

如今，在大规模推广给用户并测试自身定价策略是否有效的公司仅有四家，分别是面向企业市场的 GitHub 和 Notion，以及面向消费者市场的 Duolingo 和 Snapchat。

现在这些公司的整合方式没有令人眼前一亮的，都是比较直觉性的结合。在商业层面，大家也不偏向激进进攻，更多是通过集成保护订单胜率和现有定价。

Yusen：

这会不会成为一个典型的鸿沟跨越过程中的鸿沟？在初始阶段，大家都比较乐观，认为有了 AI 就可以起飞，因为早期采用者对未来充满期待，所以会形成很高的预期。但后来可能会发现事实上并非如此，进而陷入鸿沟。

拾象程天一：

是的，因此二级市场公司基本上没有因为与 ChatGPT 整合而股价大幅上涨，Duolingo 涨得比较多也是因为业绩表现实打实不错。

图源：拾象科技

OpenAI 组织架构给我们的启示？

坚定不移的 AGI believer

拾象广密：

OpenAI 团队对 AGI 的信仰非常坚定、纯粹。其他公司做 foundation model 更多是想做一个厉害的机关枪，兼并更多的市场和业务。但 OpenAI 不同，它在认真探索一个强大的 AGI，所以它成为了 AGI 领域的定义者。

自下而上推动创新

拾象广密：

OpenAI 早期做游戏、强化学习，后来走向了 transformer 和大语言模型，然后是 ChatGPT。一方面，ChatGPT 是一个从下而上的产品，先由项目组提出，而后引起整个公司的重视。另一方面，对 AGI 的信仰，让整个公司确定了主路线图——探索 AGI 的边界能力。

Yusen：

很多探索边界的公司会变得像一个研究组织。而 OpenAI 为了把产品做好，反而刻意降低对边界的探索。比如 GPT-4，他原本可以做很多意想不到的操作的，但他们反而选择把它做得更好，这个转变非常厉害。

强技术背景+敏锐商业嗅觉的团队

拾象痕痕：

Sam Altman 认为 Greg Brockman 是最好的招揽人才的人，早期近 60-70% 的人都是他招进来的。几位联合创始人凑齐了业内最好的工程师+科学家+企业家，团队人才密度高，每个人都是六边形战士。OpenAI 也网罗了 GoogleBrain 和整个硅谷最好的 AI 人才；微软也有对 OpenAI 大力支持，比如微软 CTO 和 EVP Kevin Scott，是第一个接触 OpenAI、将其带入微软的人，Sam 曾在第二次创业做 Loopt 就想招揽他去做 CTO。

拾象广密：

OpenAI 从一开始就不只是做研究，他们一直在做产品，并且定期都有给用户和开发者的产品。他们知道商业支持是必须的，用户使用数据对优化模型非常重要。这几位早期创始人的背景和纯科学家有较大差别，都有很强的商业嗅觉。

图源：拾象科技

哲学发问

什么知识应该被公有化？

Yusen：

我们输入给 ChatGPT 的内容可能会直接变成公共知识，也可能被竞争对手看到。有些信息属于严格私有，如个人支付信息；而有些信息则是公开的，例如 Wikipedia。这中间也存在一些模糊地带。

拾象广密：

对，但我觉得还有一个问题，即便有些信息没有变成公有，但能力有可能变成公有——你长期训练你的助理，他的项目判断能力就会变强，模型能力变强了，别人用这个东西的反馈也会变好。

Yusen：

可能某些情况下，我并不愿意将我的信息加入其中。例如，假设我是一位作家，拥有自己独特的写作风格。如果我将手稿存储在 Google 和 Facebook 上，它将一直存在于网络中。在 LLM 时代，可能每个人都能模仿我的文风进行创作。

AI 是否会有自主行为？算法和人的安全要怎么保护？

Yusen：

目前 ChatGPT 的主要功能依然是阅读。虽然现在 AI 可以帮助我们浏览网络，但尚无法帮助我们发帖。如果它能够自发地执行许多任务，可能产生很多可怕的后果。AI 现在具备一定的自主行为能力，但它是否能够独立执行任务、是否能够帮助人们大规模、高速度地完成任务，将产生重大影响。

拾象广密：

举例来说，Zoominfo 推出了一个很实用的功能，它可以自动生成针对客户的邮件，CRM 系统直接将这些邮件发送出去，并跟踪这些回复的潜在客户。我觉得这也有一点类似于发帖。

Yusen：

GPT-4 在安全方面强调，不希望 GPT 具备长期规划能力，因为如果赋予它一个目标，它可能需要获得许多控制权，从而可能导致不可预测的结果。因此，现在的 ChatGPT 仍然遵循“你说它做，你不说它就不做”的原则。尽管它可能具备长时间、自主地执行任务的能力，但目前的安全措施不允许它长时间地、自主地执行任务。因此，未来大型语言模型的安全性将变得非常重要。

拾象广密：

安全一定是很重要、很值得投的。不只是算法上的安全，还有人的安全。未来最大的安全公司可能是保险公司，比如我买这个助理的一年使用权，最后出了事可能由保险公司来垫付。

另外，版权也是一个重要问题。Midjourney 也遇到过版权问题，所以上市公司如英伟达、Adobe 就不敢用有版权保护的图片去训练模型，于是效果可能不如 Midjourney，但好处就是他们可以在 ToB 领域服务一些大客户。

拥有超级助理的未来，到底 AI 和人谁能更懂你？

拾象广密：

以后的 AI 公司都是助理服务公司。未来有了助理后，可以直接对着手机说帮你做什么事，减少很多打开 APP 和 SaaS 系统的时间。APP 这种形式可能会被打散，不再有 APP 间的壁垒。而且，大语言模型对于供应链比较强的公司是有促进性的，复杂的供应链要做反向优化，像适应以前的搜索引擎优化（SEO）一样去适应助理的优化。

Yusen：

助理的搜索引擎优化（SEO）确实非常重要。比如，我们办公室的助理需要决定选择哪家外卖服务或物流公司，这其中涉及线下资源和实体服务。未来，像 ChatGPT 这样的超级流量入口可能会成为新时代的搜索引擎。

拾象广密：

假如 ChatGPT（或者中国的 ChatGPT） 变成了一个 1 亿活跃助理的超级流量入口，那么很多供给都会主动去适配它。那时还可能会形成新一代的网，以前是人和物的网，现在包括人和助理、助理和助理，将会是一个更复杂的网络。

Yusen：

但是，我们是否能确保 AI 助理的记忆和能力得到清晰划分？我的助理能否成为保护我的信息的壁垒？还是会在云端为所有人服务？就像电影《Her》一样，同时跟所有人恋爱。