中国科技界针对大模型的态度,大体可以分为两派,一派信仰技术,一派信仰市场。
金沙江创投主管合伙人朱啸虎属于后者。最近,他的一番表态引发不小的反响。他说自己不看好大模型,「一看就知道肯定没戏」,他只信仰能马上商业化的应用。不过,朱啸虎也提到,自己挺看好王小川。
王小川有着漂亮的履历。当年顶着「天才少年」的光环加入搜狐,11 个月开发出搜狗输入法,后来又拿出「浏览器+输入法+搜索」的「三级火箭」方法论,并推动搜狗独立在纽交所上市。那时他就觉得,搜索引擎是实现 AI 的路径。只是当年,这条路并没有走成功。2023 年,王小川创立人工智能公司百川智能,要继续实现自己的技术理想。
▲ 王小川 | 图源:36氪
入局大模型赛道一年,王小川做了哪些事情?他如何看待 AI 技术的落地与未来的应用场景?以下是与他的对话。
文末还有完整对谈音频,不要错过。
声动活泼
最近朱啸虎关于大模型的言论引起了广泛讨论,你对他的观点有什么看法?
王小川
朱啸虎的表达是很率真、真实的。他有自己的投资逻辑,首先要有应用场景,其次这个场景能赚钱。他的逻辑是自洽的,也体现了他对出资人的负责态度。不过他的观点并不代表所有人。

今天大家开始站队,理想主义还是现实主义,有人谈技术理想,有人谈生意,本质上都代表一种看待世界的视角。但一个视角并不一定是全部的真相。这就像盲人摸象、小马过河。其实我们每个人都是「盲人」,都只能看到局部。
而「小马过河」指的是每个公司、投资机构都有自己的角色和选择,我们不是上帝,我们得做自己。比如 OpenAI 的「登月计划」想把 1000 万个 GPU 连在一起,实现更大规模的计算。而英伟达一年生产的高端芯片也就 100 万个,此外还需要半个小镇面积的场地和无限量的供电。所以美国公司在想的事是未来能源会不会不够用,他们有他们的定位。而我们也有自己的定位,比如以朱啸虎为代表的一派,并不要求企业做多大,但要尽快找到场景,赚钱盈利。
声动活泼
从追求回报的视角去看,这样的做法似乎更规避风险。
王小川
投资人也有不同类型,有浪漫派的,有现实派的。最重要的是要找到自己的道路。
声动活泼
你认为朱啸虎的观点有什么疏漏吗?你在一线,投资人还是更靠后一些。
王小川
他对大模型并没有直接的体感。
当下做技术投资有两种角度。一种是「信仰」或「高看」技术,觉得技术能做这个,能做那个,这种投资可能成功也可能失败,是有风险的。另一种是「俯视」技术,更多关注技术带来的价值和场景,技术能否解决具体的问题。这种做法不会犯大错,但可能错失很多机会。尤其当下颠覆性的时代到来,我不会只去「畅想」技术带来的改变,我认为我是看到了未来具体能够变成什么样。
去年 4 月份下场创立百川的时候,我就说未来 AI 会变成我们的伙伴,一方面帮助我们提升生产力,一方面为我们供给专业知识,比如医学、法律,甚至购物指南。更进一步,AI 不仅能够成为我们的伙伴,还能创造出虚拟的娱乐天地,让大家去玩去体验。那时,我对未来就已经有了清晰的画面。
我觉得当下既懂技术,又知道技术能在未来达成什么样的商业场景的人是比较少的。
声动活泼
你认为朱啸虎的观点在多大程度上能代表现在投资人的想法,大家普遍比较悲观吗?
王小川
我觉得有这种想法很正常。大模型的技术变革带来了两个颠覆性的变化。第一是模型越大效果越好,这就需要持续不断对模型的投入;第二是模型和应用之间的关系发生了变化,模型大了之后应用被碾压了,甚至出现模型即应用的情况。所以就投资而言,如果没有对场景的把握,就会感觉这是个无底洞。

过去我们习惯的路径是,美国把技术问题解决完,我们再去做场景。现在是技术一直向前迭代突破,确实很多投资人不适应,投资方式也会发生变化。
声动活泼
到今年4月,百川智能就成立一年了,你的体感怎么样?就商业化而言,创业公司到底能做到什么程度?
王小川
现阶段商业化还远不在我们的关键词里。
过去一年我们做了两件事。第一件是建立团队,而且我们的大模型在中文领域很多任务上的表现已经远超过 GPT 3.5,接近 GPT 4 的能力。第二件是我们发布了百川的开源,我认为这对中国的大模型事业是有贡献的,现在很多公司,包括大厂,都在用百川的开源做自己的模型。
我之前做输入法,比市场晚 4 年开始。这一次,我们与时代的脉搏是相同的,我们能看到技术的未来,同时凭借技术敏感把最新的技术应用起来,转化成我们想要的产品,同时还能做一些技术上的创新。
声动活泼
去年你去美国考察,说目标要变成「技术上慢 OpenAI 一步,应用上快三步」,但你又说商业化并不在百川的关键词当中,这是相悖的吗?
王小川
落地不代表立刻商业化,有应用导向,有场景,在场景端先把价值创造出来,就叫落地。我们之前默认的方式是 PMF(Product Market Fit,产品市场匹配),有了产品就可以直接和市场对接了。但今天我们要解决的问题是 TPF(Technology Product Fit,技术产品匹配),这是不同的做法和路径。
声动活泼
复盘过去一年,你觉得百川做得最对的策略或选择是什么?
王小川
第一个是下场做,百川是在智能纪元元年诞生的公司。现在的技术发展太快了,晚两年再做,就很难入场了。第二个是迅速发布开源。

回看我下场时所提的一些技术主张,不论是既要有大模型又要有超级应用这样宏观的想法,还是打造开放世界的方向,选择创造健康、快乐这一具体赛道,以及增强垂域、增强搜索、增强强化学习等理念,今年都会开始兑现。所以我们下场是对的,对未来的愿景在今天看来也没有走偏。
百川的中心是做医疗。大模型把语言变成了数学,而我希望做的是生命的数学模型。我认为大模型能帮助我们更好地通向更远的生命世界。
声动活泼
在「AGI + 生命科学」这个方向上,你预测接下来最有可能落地或迅速发生改变的功能或领域是什么?
王小川
一个是问诊。现在医生误诊的很大一个原因是漏诊,也就是医生没有问对问题。在这个场景中让大模型去思考发问,能充分展现它的能力。
声动活泼
百川可能是国内一线大模型厂商里对医疗场景最看重的。但根据以前的经验,不论是 to B 还是 to C,医疗是一个非常难落地的领域。大模型能够简化落地的门槛吗?
王小川
大家对医疗的本质没有太深刻的理解,今天医疗最缺乏的资源是医生,但医生的供给有限,而且很难快速培养,这不像互联网可以通过改变生产关系来提高供给,所以做「挂号网」或辅助应用是没有意义的。核心问题是要造出更多有医生知识、能够提供服务的「人」,互联网并不是在造「人」,而是在解决信息传递的问题。
声动活泼
所以之前很多 AI 公司去做影像辅助诊断,是行不通的?
王小川
是的,因为没有解决机器的认知问题。医生的学习路径是学知识,形成融会贯通的逻辑。影像辅助诊断的模型只能在图像里学经验,是没有语言知识的概念空间和逻辑的。
声动活泼
百川已经上手做了一年大模型,您觉得从什么方向思考能够挖掘技术新的能力,让新产品远优于潜在产品?
王小川
技术的核心是在造「人」,不是在造工具。人和动物的区别是什么?第一人会语言,语言代表了你的思考、沟通、文化,第二人会创造和使用工具。所以利用大模型优势的核心在于造「人」,由「人」来创造并使用工具,而不是造一个原来就有的工具。大模型并不是一个精确严谨的计算器,也不是一个分担体力工作,帮你搬箱子、刷盘子的工具,它是一个智力引擎。搜索引擎更多是帮你连接、寻找信息,而大模型是一个自带知识的智力引擎,甚至可以成为一个推理引擎、决策引擎,帮助你做决策。
声动活泼
去年你在采访中提到,早早关注落地的应用可能会让你很难去实现 AGI。在做了一年大模型之后,你还是坚定地要实现 AGI 吗?
王小川
是的。从技术理想主义的角度看,AGI 是必须存在的,不可绕过的话题。只是在爬这座山的时候,我们得知道中间是有补给站的,这样一个场景既是能快速起步的,也是和 AGI 同频的。

同时我们希望场景的天花板是足够高的,比如写广告文案不需要一个特别大的模型。所以在场景选择的过程中,一定得知道什么场景能和 AGI 同频,甚至是更高的。我们认为生命科学、生命模型和它所映射的从医生到制药的这一套体系,是不小于大模型的。
声动活泼
与一年前相比,您对 AGI 实现路径的认识有没有什么变化?
王小川
我对模型的理解大体上没有变化,现在依然坚持语言的中心位置,智力是藏在语言里面的。

不同的公司有不同的选择,有的公司选择在模型上面做应用,有的公司选择不断改进模型。我们还是选择自己认认真真把模型从头做出来。
声动活泼
Sora 的出现让人感觉技术进步的速度越来越快,你觉得和 OpenAI 之间的差距会不断拉大吗?
王小川
OpenAI 现在拥有人才、算力和资金的制高点。如果论横向新技术从 0 到 1 的突破创新,我认为差距还是在继续拉大的;但如果一个技术已经完成从 0 到 1 的突破,要在一个方向纵深,变得可用,中国的速度还是了不起的。

另外我要澄清一个误解,Sora 能从文字生成视频,大家觉得好像比 ChatGPT 高级了,但其实看上去更「Fancy」,并不代表技术更强了。大模型能达到万亿参数级,而 Sora 现在只有百亿参数级。另外,视频所表达的是肉眼可见的空间,而语言所表达的是概念层面的空间,其表达能力是远高于视频的。
▲ Sora 生成视频截图。| 图源:Sora 官网
声动活泼
所以 Sora 对于真正做大模型的人来说,意义有多大?
王小川
不大。Sora 只是一个简单表层的模拟,产生的 AGI 属性远远低于 GPT。

智力的本质是进行分类和类比,而这在语言里是已经存在的。不论是做视频理解,还是视频生成,重要的都是跟语言空间对齐。而 Sora 没有解决视频表达跟语言空间统一编码的问题。你可以认为它是 OpenAI 一个研究上的子项目,是一个部件、一个边缘项目。
百川也不会做 Sora。因为它既不是 AGI 的主线,也不是一个具体的应用方向。
声动活泼
你对 2024 年的大模型产业有什么预测?
王小川
我觉得美国还会不断冒出让我们吃惊的进展。但我觉得国内是能追上美国的技术的。另外,各个厂商也开始探索自己的场景,我对差异化的发展是比较乐观的。
声动活泼
现在很多人认为大模型在国内拿钱已经不容易了,如何说服投资人继续投资呢?
王小川
从传统的 VC(风险投资)那里拿钱确实很困难。我认为往下有两种力量能够投资,一是传统的大厂,比如谷歌、亚马逊、微软,另一块是政府。
我们从一开始就觉得 CVC (Corporate Venture Capital,企业风险投资) 是最应该争取的,CVC 会比其他 VC 提供更长久的支持。
声动活泼
做大模型的人会对未来可能实现的东西有恐惧吗?大家可能也不知道 AI 后面的力量有多强大。
王小川
我在官宣下场时写了一句话,「我们要发展 AGI,帮助我们繁荣和延续人类文明。」繁荣和延续,这两个选一个都挺好的,未来是美好的。
更偏重技术,还是更偏重市场,是创业者和研究人员长久以来都要面对的矛盾。即便是站在 AI 发展制高点的 OpenAI,也难以避免由此而引发的波折。不过至少眼下,王小川表明了自己的态度。
你觉得暂时看不到商业化前景的技术值得投资吗?来评论区分享一下吧。
以上内容整理自
声动活泼旗下播客「商业 WHY 酱」
想了解王小川更多看法
欢迎点击收听
也可在各大音频、播客平台搜索本期节目
监制/徐涛
编审/东君
编辑/Siti
视觉设计/Mori
排版、运营/Siti
更多有趣问题
欢迎来声动活泼找答案
继续阅读
阅读原文