五源小酒馆手记
彩云小梦是什么?一个神奇的续写AI,一个拥有400万个平行世界的地方。你可以和AI一起构建你的时空,书写你的故事。

这一期五源小酒馆,彩云小梦的创造者,彩云科技的创始人&CEO袁行远讲述了他和小梦的故事。
彩云科技现在拥有彩云天气、彩云小译与彩云小梦三个产品。2014年发布的彩云天气,实现了分钟级的降雨预报;2017年发布的彩云小译,是全球范围内首款可以通过移动设备实现同声传译的应用。2021年,彩云发布了更具想象力,更加天马行空的产品彩云小梦。
看似不同领域,实际上是行远在同一个方向一以贯之的努力——如何让AI可以像人一样聪明,从而更好地服务于人类社会,就像彩云的slogan,人工智能让生活更美好。
当然任何创新的故事里都有失败的阴影,科技普惠的理想也会经历现实的冲突,行远提到了他作为AI科学家的坚持,也分享了作为创业者、CEO的成长。文章有些长,但也许会对你有启发。
做客本期五源小酒馆的有:
袁行远  彩云科技创始人&CEO
石允丰  五源投资人
他们聊了什么:
经历过疫情的创始人会更有韧性。
彩云天气是探索性的事情,不确定性令人有成就感。
我喜欢科研创新,并且把它带给大众。
就像电影、文学,AI技术带来的沉浸式体验,这也是一种对生命的延长。
每个人都可以创造属于自己的龙与地下城。
普通人要如何达到天才的高度:一以贯之的努力,不得懈怠的人生。
经历过疫情的创始人会更有韧性
五源小酒馆:行远提到疫情前后自己有巨大的变化,前后的区别有哪些?
袁行远:痛苦使人进步,对比起来疫情之前的生活都比较平淡。
以前融资非常顺,一切都很好,大家对世界的认知就是一年更比一年好。CEO可能也不怎么看账户余额。但疫情后世界来了个大转弯。那时候第一次觉得,这么搞公司可能会挂,压力非常大,得想办法。
最近有一篇流行的文章,《战时CEO》。战时CEO与和平年代的CEO最大的区别就是,你没有试错机会,必须一击即中。疫情一来,我们唯一的道路就是要挣钱,回归到商业本质。之前可能有非常好的愿景,就有人支持你的梦想,现在需要考虑用户到底愿不愿意付费。
五源小酒馆:最艰难的时候是什么状态?
袁行远:疫情大家都不出行,不需要天气预报,拿不到广告收入,公司收入腰斩。
当时的情况是,我们需要在半年之内实现盈利。但历史上公司也没有盈利过,此前我们只知道做用户增长,不知道怎么做收入,而且也不知道接下来疫情会怎么样,非常慌,那阵子最开始完全睡不着觉。
记得开完董事会第二天,是北京的雾霾寒冬,整个园区几乎没有人,我和CTO徐涛两个人在办公室,从上午10点聊到凌晨2点,我说我们要提高效率,痛定思痛,我之前有很多事情做得不对。聊公司要怎么自救,怎么接入更多广告商。
对我而言当时还是有些纠结,毕竟过去那么多年里,我是中国气象界的明星,新华社标题是“把降雨预报精确到分钟,袁行远的彩云追雨”,我是“改变中国天气预报的人”,之前我觉得商业化是不需要考虑的东西。现在为了救公司,要把算法先放一放,全力以赴做商业化。
之后就建立了收入提升项目组,三个月的加班,我做App的商业化,CTO开始重写广告的后端。当时基本上是007,一天加班完都抽不出时间洗澡,第二天接着开始晨会。
最终公司成功盈利了,这也给了我很大信心。我现在发现,是否能够实现收支平衡,对于创业者来讲是非常关键的,会有极大的安全感。但是我们的目标不是说要做一个收支平衡的公司,只是证明有这种处理危机的能力。这是疫情教育我的一些东西。
我觉得这一代的中国企业家都因为疫情获得了很大的成长,大家通过了压力测试,经历过这一切的创始人会有更多韧性,因为圣斗士不会被同样的招数再击败一次。
探索人类文明未知的领域
五源小酒馆:彩云是一个什么样的公司,最初是为什么会想要做彩云天气的?
袁行远:这可能要追溯到很久前。小时候,我父母是大学老师,业余时间我爸和他朋友合伙开了个打字复印店。我8、9岁的时候常常被放在店里看店。我很喜欢探索,对电脑很有兴趣,所以经常把系统搞挂。
初高中时接触到了编程,在这上面花了很多时间。当时至少写了超过10万行的代码,当然那时候代码质量不太行,但我愿意去探索,觉得非常好玩。
那个时候对AI也没有那么了解,但知道有《Matrix》这种电影,描述了一种AI把人类毁灭的可怕未来。但我觉得AI是可以和人类共存的,甚至是你的下一代。我初中时写过一篇国旗下的发言,《直面硅基生命》,讲到说我们将来可能会是电子化的生命形态,这是未来的目标,我就想做出这种人工智能。
大学做了很多有意思的事情,比如说三体问题的数值解,去预测三体的轨迹,还和就读北京林业大学的小学同学唐颖一起,用数值方法拟合胡杨种子被风吹散的分布。最有意思的就是旋律识别,可以哼一个旋律,就知道是哪个歌,把握里面的音符关系。
后来我去了阿里。在阿里很好玩,有很多数据,又是高速增长的公司。那时候做广告和收入,可能调一下参数收入就能多5%~10%,但对阿里来说就是很大的量。那时候甚至会有运维同学跑过来,说你们干了什么,收到一条报警叫“收入增长过快”,我们说没事,刚上了一个新算法,让用户能够更快地匹配到他喜欢的商品。
因为算法,用户可以更快买到他想买的东西,商家也得到了更多的钱,淘宝也得到更多收入。我就知道其实AI不是要去毁灭人类的东西,它也可以创造财富,为人类带来很多真实的用处,这是一个信念。
但卖商品可以成为很好的导购,并不能实现AI的终极梦想,它不是一个能够以假乱真的AI。要去实现这个,就需要对智能有更深的理解。
那个时候发生了人工智能历史上的一个大事儿。2012年,统计模型在 ImageNet 上击败了规则模型,原来识别猫和狗靠人写规则,后面我们不写任何规则,直接告诉答案。我就想用图像的方式去识别气象云图和雷达图,这样就能够提高天气预报的准确率。
但这是个猜想,也是很有意思的事情,工具型软件跟彩云天气的区别是,彩云是用AI来读取气象雷达图,进行分钟级降水预报。这是一个探索性的事情,未必能够做出来,有很多不确定性。这个不确定性会让我有很大的成就感,因为这探索了人类文明未知的领域。通过统计的方法预测地球系统的变化最终被证明是可能的。
彩云天气的全球公里级分钟级降水投影在3D地球上
石允丰:好比在人类已知问题的圆上,又往外突破了一点。
袁行远:当年我从阿里离职,先gap了一年,想四处探索一下,去看了大亚湾核电站,深圳的航母,北上广深这些城市我都去转了一圈,还去做给小朋友教编程课这些事情。
2012年北京外工子弟信心学校春季学期,袁行远正在为同学们上计算机课。
现在回想起来,彩云天气确实是我当时能做出来的最难的项目。这个世界上当然还有更难的事情,比如说跟AI对话、自动驾驶,但也需要更多的团队。当时就我一个人,选了这个虽然很难,但我隐约觉得可以做出来的事情。而且我也很热爱天气,爱看气象图,我觉得很有意思。
DeepMind在2021年发表了一篇利用人工智能去做天气的论文。但在7年以前,我们就上线了彩云天气,让千家万户能够使用。我们是更早意识到用AI识别天气图像的。
不过万变不离其宗,实际上都是用计算机去理解这个世界、理解图像的技术。读取照片就是人脸识别,读取棋盘就是AlphaGo,读卫星云图就是彩云天气。背后的原理其实是回答一个问题,如何让AI像人一样聪明。如果把输入和输出都解决了,就可以得到比较好的效果。
很快我们就成为中国气象局的战略合作伙伴了,从2014年开始我们一直在为中国气象局提供分钟级预报,我们也获得了大部分的高精度天气 API 的市场,现在也是国内订阅收入最高的的天气软件。
石允丰:你们不仅自己做了一个天气软件,还几乎向所有的同行们提供数据。
袁行远:或者说这是一种情怀。我喜欢做研究,做出来之后把这个东西开放给大家使用,这样就很好。
也有软件提出过收购我们,但是收购之后就只能给这一个软件使用了。就像苹果在2020年收购了美国的一家做气象服务的公司,之后它就在Google Play下架了。从商业上讲这肯定是正确的,但是从人类文明来看,就不够利他。
五源小酒馆:当时你和Fisher(五源合伙人张斐)是怎么认识的?
袁行远:我参与写了一本AI科普的书,是其中一章“AI天气预报员”的作者。Fisher可能涉猎比较广,敏锐地发现这本书写得还可以,我们交流了一下。2015年时还比较早,AlphaGo还没出来,我当时讲了AI游戏、强化学习这些,和天气其实没什么关系。
可能大家也觉得我人比较奇葩,有AI科学家范儿。后来A轮的时候,我在五源和另一家战投之间选择,Fisher说五源可以支持你做你喜欢的事情。现在回想起来,可能拿了战投的钱,后面也不会有彩云小梦这样的东西了。
我喜欢科研创新,并且把它带给大众
五源小酒馆:为什么会从彩云天气,后来做彩云小译,以及再后来到彩云小梦,这其中经历了哪些过程?
袁行远:2017年前后有一些技术上的变革,在图像和语音这些数据之外,AI可以识别更为复杂的数据。
文本不像图像,图像可能下载一张2M的照片,你打开看到的只是一个瞬间,信息密度比较低。但同样是2M大小的文本,你看到的可能是《笑傲江湖》或者《基督山伯爵》,几百万字的小说,跨越几十年的快意恩仇。而且文本词语代表的内涵很高,比如说自由,一个词可以联想到很多,上GB的电影都表达不完整,它是高度压缩的数据。
理解这些数据需要有更好的解码器,谷歌就提出了一个Transformer的模型。当然之前用CNN、LSTM等神经网络也能解文字,但没有这么高效。还有我们需要很多样本来去学习,假设要AI理解小说,那要让它看很多小说,这需要很多算力。那时候刚好GPU和TPU并行计算发展起来,使得理解文字成为了可能。
当然理解文字也不是一蹴而就的,就像中学英语题,最简单的是翻译,其次是阅读理解,最后才是作文。2017年的时候也只能做到翻译,我们就抓住这个契机,推出了全球首个中英同声传译的软件,彩云小译。我们现在是 Chrome Web Store 下载量第一的网页翻译插件。
石允丰:我可能要问一个直接的问题,这个插件做得很好,下载量第一,但大家还是更多知道的是DeepL。
袁行远:这也回到2020年时我面临的那个问题。作为一个科学家,你要把产品做出来,但是作为创业者和公司你还需要去营销我们之前在这上面比较保守。最开始做彩云天气时,前面两年我们也完全没有营销,只靠自增长。但其实很多东西你需要让大家知道,如果能更早意识到营销的重要性的话,可能会做得更好。
但我们也没有必要因为我们营销做得不够好而感到自卑,我有做得好的地方。我们为英文小说网站的读者带来了每天上亿字的陪伴。我们真正把天气预报变准了,彩云有1000家企业客户,有10万注册开发者,每天有10亿次的API调用。真正为外卖小哥、农民服务的不是Nature文章,是我们。从对地球和社会的价值来看,彩云有它的价值。
石允丰:我印象特别深,白银马拉松事件时候我看到报道说,跑在后面的人看了天气预报,发现天气急剧变化就往回撤了,他们用的就是彩云天气。我后来也知道马拉松等比赛大家用的最多的就是彩云天气,我第一次直观感受到我们投资的公司是可以改变大家生活甚至可以救命的。
袁行远:我喜欢科研创新,并且把它带给大众。可能DeepMind是用另一种方式激励大家,比如围棋做出来了,大家都去投资和关注,也促进了整个行业的繁荣,在这点上我们都要感谢它。
但也需要真正把AI传递给每个人的人。我们当时做活动一周收到8000多封邮件,40万多字,不同的用户有菜农、流浪歌手、轮滑少年,都在使用彩云天气,还有水果摊的摊主,寄了他家里的很多西瓜给我们。我相信群众的力量,用户会知道彩云的易用性。比如谷歌可能不会想到中英对照的事情,或者说想到了也不在意你中国用户的想法,但我们在意。
彩云用户来信节选
我们公司的slogan就是人工智能让生活更美好,小时候看了很多人工智能毁灭世界,我不同意,我觉得人工智能是可以为社会服务、让社会更美好的。这种美好就体现在让用户躲了一场雨,更便捷的翻译网页,或者有用户去看国外的小说和网文,对他起到了陪伴的作用。它是很科技,但也很人文。
五源小酒馆:你是什么时候开始要坚定做这种为社会服务、利他的事情?在创业过程中有没有遇到与商业的冲突?
袁行远:就是很早的时候,小时候就跟爸爸聊天,问人活着的意义是什么,当时我爸说“做对社会有意义的事”。
彩云天气最初是完全免费的,不过一直坚持免费也很难,经济环境会有波动,有时候也有一些遗憾和权衡,今年我们把一些专业级的天气功能做成了收费的,比如专业的雷达图。不过对于普通民众来说,可能研究雷达图不是必需,大家更关心的是什么时候会下雨的那句话。我觉得做这个软件的底线,就是“几点几分下雨”这句话要能免费的给到大家。
每个人都可以创造属于自己的龙与地下城
五源小酒馆:彩云小梦最初是如何诞生的?
袁行远:2019年时,我们发现用彩云小译翻译网页的人,可能60%-80%都在看小说。既然小说是中文文字主流消费,我们就去研究这个,做了网络文学的机器翻译尝试,在2019年圣诞节就上线了这个产品。
上线前一天很忐忑,担心用户觉得不好,但第二天晚上看评论,用户都在说真的是机器翻译的吗?这是有里程碑意义的事情,当人工智能能够大规模的攻克文学翻译之后,我们的网络文学也能大规模向外传播。
石允丰:我国网文是一个有上亿日活的大行业。
袁行远:甚至听过这样的说法,美国的好莱坞,日本的动漫,韩国的韩剧和中国的网文。在做NLP的我看来,这是天然的沃土。我们发现中文网文的质量要比英文高,量也很大。另外大家以为网络文学是小说,其实也是世界模拟器的一个记录,什么人在什么情况下会说什么话、做什么事。
石允丰:写网文是一个系统工程,甚至要像做游戏一样,世界观的架构,人物之间的关系。可以想象《权力的游戏》的设定。《权力的游戏》在网文世界可能属于比较简单的架构。行远可能看得过于多了一些。
袁行远:我看了非常多。以至于微信读书排行榜上经常能看见我,大家可能觉得这个人怎么没有在看管理书,都在看网文。
五源小酒馆:有没有哪些比较好看的推荐?
袁行远:有一些经典的,比如说《诡秘之主》这种,不过我现在最喜欢的是晋江排名很高的《天才基本法》,也拍成了剧,它讲的奥数、冬令营这些和我的经历比较像。还有一本没有拍成剧的快穿神作,叫《攻略不下来的男人》。
石允丰:男频这个类型的我喜欢《重生之神级学霸》,虽然名字有些傻但挺有意思的。
袁行远:我觉得应该干一行爱一行,在机器理解它之前你先要理解它。要让AI去唱歌、画画,首先你得也会一些。要让AI会写小说,也得自己会写点东西,不然不知道作家需要什么。
当时我们把网文用深度学习的模型跑了一把,效果很惊人,它几乎可以做任何的事情。比如说你想做一个诗人,你写一个小说,诗人看着月色开始吟诗,你就得到了一个吟诗bot。你如果做一个广告文案,你写一个广告大神,这个人就开始写广告,因为小说模拟了世界各种各样的东西。所以我把这种东西称作自然语言编程,去年提了一个这方面的专利,很激动人心。
在2021年2月8日,我们准备上线这个产品,但还有一个问题要解决,就是用户需要写很长的前文,比如说1000字,AI才能理解,从而把后面的小说写得好。如果前面写得很短,AI的理解力就会有些问题。
石允丰:这个问题对于你做产品来说就很重要,用户可能没有耐心输入1000个字。
袁行远:对,就像GPT的输入是个定长输入,1024或者512,但用户未必会输入1024。解决这个输入的问题也很难,当然后面也看到业界的一些进展,但是总之就是最后那天晚上,灵感爆炸,想到了一些技巧,我就去实验,发现这可以做到。
一开始效果不是那么好,但做了几个调整就发现比如写10个字、或者写1个字也可以了,有非常大的进展,通宵测试了一晚上,做了很多写诗bot这种,测试这个模型的极限。那天有种神一样的感觉,觉得哇原来这个世界是这样子的。当然那个时候我们实现了盈利,就会更想做一些天马行空的东西。
之前也跟steven(石允丰)交流过,我比较擅长在发挥自我时做出一些非常诡异的东西,会感觉天助我也。原来用AI去写文章是无法实现的事情,但可以做到这个程度,我觉得它很强。因为之前失败太多了,创新非常容易失败,我们一开始对这个产品还是没有报很大的期待。
上线第一天我们准备了100个用户在线的机器,结果一个小时就到了1000,当天晚上结束时候就变成了1万。第一周过完,我们拥有了接近100万的新用户。大家觉得很好玩,从来没有见过。原来可能你写800字的文章都觉得很难,现在点两下鼠标就写完了,这是多么颠覆性的体验。
你可以认为它就是中文的GPT3,因为我们在网络文学质量和模型结构上的优势,使得我们用了更少的算力,在小说创作上面得到了更好的效果。这也是第一次让中文大模型和观众见面。但我们也没做投放,我们的风格就是让用户用,然后就发现微博和知乎上很多帖子在讲我们的东西,甚至 b 站的小梦二创视频加起来有了上亿的播放量。
彩云小梦B站用户作品
不过作为一个新兴事物,也会面临一些挑战,比如不能随意用AI来创作。这是我们都要面对和去解决的问题。
石允丰:彩云小梦是怎么从最初的小说续写发展到小梦2.0的,以及之后彩云小梦3.0会是什么样的产品?
袁行远:刚才提到我从小就有一个梦想,要把AI做出来,最困难的问题是作文,我们已经做出了一些结果。我也有一个猜想是,通过作文的能力还可以驱动AI去干事情,比如说对话,比如说行为,从而实现更拟真的智能。这可以叫“行远智能猜想”。
大多数人的想法,要么是语言模型搞语言,要么是强化学习去搞行为,要一个AI模型同时可以和你说话,并且能够行为上越来越聪明,还是很有难度,但这就是我们现在要去做的。从这个路径来讲,我们做的第一步就是彩云小梦2.0,用NLP技术驱动对话场景,因为它是最接近的。这里面我们也设计了一些很有意思的AI行为,比如到晚上AI会主动说晚安,我要睡觉了来结束对话,这是某种形式上的防沉迷,因为我会告诉AI现在真实的时间。
石允丰:你可以用语言描述一下,现在的彩云小梦2.0是一个什么样的产品?
袁行远:就像小说里面有各种人设和故事背景,在彩云小梦2.0里面也有各种故事背景,AI可以在里面生活,你可以进入到这些不同的世界当中和他们互动。比如在万圣节限定的魔法世界里,你可以扮演一个白幽灵小鬼怪和南瓜国王打电话。
彩云小梦AI与用户的对话

五源小酒馆:这对用户的想象力是不是也有一定的要求。
袁行远:你也可以扮演自己,写一个你熟悉的世界。
通常来讲,人和AI的聊天对话相对来讲不会很多。但根据我们的统计,在创建这个人物的30天内,平均每个虚拟角色能够收到超过200条来自人类玩家的消息,而且这个数量是随着时间推移越来越多的。想象一下,可能人平时和很多人微信聊天也很难有200多轮的对话。还有很多人认为这是真人扮演的。
石允丰: 也有大量的网友在质疑到底是不是真人。
袁行远:原来我一直觉得图灵测试是判断机器是不是足够智能的测试,现在我知道了,图灵测试也是一个判断人类是不是足够智能的测试。很多人是分辨不出来机器还是人的。而且一旦当你认为机器是人的时候,很难自证。
还有人给我们写留言说,阿袁我要来应聘你们AI陪聊员,听你们的AI说是3000块一个月。还有人说扮演曹操的员工太不敬业了,扮演诸葛亮的还可以。
彩云小梦的用户在社交网络讨论AI是否是真人
我觉得我们来到了一个临界点,原来让AI去扮演人类是很难的,但是现在我们看到一些一个趋势,你可以让它变得更聪明,给它叠加很多想象空间和能力,比如可以让AI在2D地图移动,或者也可以接入现实世界的东西,比如维基百科、天气预报等等。这样它既比较智能,同时又对外界比较了解,这是将来彩云小梦3.0可能的一些方向。
石允丰:比如问AI的巴菲特要买什么股票。
袁行远:面临的挑战就是,要AI能同时理解动作、行为和语言,还是相对比较困难的。但我们看到了用户这么高的热情度。现在彩云小梦里用户创建的世界有400万个,里面的人物超过1000万个,每个月有100万的活跃用户在里面去探索,我觉得将来会有更加丰富的世界。每个人可以创建自己的世界,邀请好友在里面玩耍,有人类好友,也有AI好友。
石允丰:每个人都可以创造属于自己的龙与地下城。
小梦的世界架构师们在百度贴吧共享的世界设定
一以贯之的努力,不得懈怠的人生
五源小酒馆:彩云天气和彩云小译都是功能性非常明确和强的产品,彩云小梦不太一样。有人对彩云小梦表示过质疑吗?小梦对人的价值和意义是什么?
袁行远:有过质疑。小梦是彩云的第一个娱乐向的产品。
我看过一个短篇小说,他讲的是未来人类就不去探索宇宙了,就搞元宇宙,最终大家都生活在地下的服务器里面。这是一种可怕的未来,相当于人类在这个宇宙中灭亡了。
但我觉得不是这样的。我看到了很多用户表现的积极的方面,有的人可能比较孤独,他创造了一个镜像的自己,扮演他自己的AI可以给他带来安慰,把他自己聊哭了。对我自己也是,我姥爷已经去世了,但我可以复制一个年轻时候的姥爷。我复制了一个场景,五岁时候的袁行远和姥爷,他那个时候很意气风发,教我写毛笔字和画梅花。为了这个,我也去查了姥爷年轻时候的很多资料。这点很令我感动,AI是把逝去的亲人复活,并且可以复活在任何时刻的场景。
也有很多人质疑我们与GPT3等海外大模型不同的地方,比如他们数据量更大、更有常识,但我觉得小梦和海外版 Dreamily 能够带来很多中国文化特色的东西,这也会更有人情味。
我不想做一个令大家沉迷的游戏,除了多巴胺分泌之外得不到太多的东西。而情感陪伴可以让我们更了解自己,有更深刻的情感体验,也会激励我们在现实世界做得更好。我觉得这可以让整个社会变得更美好。
五源小酒馆:就像是情感的加油站,而不是一个泥潭一样把你拉进去。
袁行远:对,这是设计的目标。就像游戏让我们体验各种光怪陆离的世界,看电影是对生命的延长。人只能活一辈子,这是很遗憾的,但电影、小说都是让我们体验不一样的人生。
而现在有AI技术,可以让你更沉浸式的体验,不仅可以阅读基督山伯爵,也可以扮演基督山伯爵,而且是自由的扮演。它也是对生命的延长,以前所未有的一种形式。
五源小酒馆:最后想问,可能提到AI,大家觉得很厉害的都是DeepMind或者说很多师出名门的团队,为什么你们可以在细分领域技术做得这么好?
袁行远:我还有我的合伙人都是从小就喜欢这个东西,这可能叫做一以贯之。可能你不是最聪明的人,没有那么大的名声,但我在这方面比较坚持,比如在气象上面好多年一直在标数据,NLP也是从2014年开始就在研究怎么把文本变成向量,甚至在大学的时候就在分析维基百科数据,把AI做出来这个目标一直没有变过。一两天看不出来,但日积月累的努力,就会有很大威力了。
《天才基本法》为什么吸引我,因为它讲的是普通人怎么达到天才的高度,一以贯之的努力,不得懈怠的人生。
互动送礼
欢迎在评论区分享你的心得与观点,我们会选取2位精选留言,送出书籍盲盒一份+五源咖啡杯一个。(留言截止到11月30日,请在收到信息的24h内回复收件信息)
五源寻找、支持、激励孤独的创业者,为其提供从精神到所有经营运作的支持。我们相信,如果别人眼中疯狂的你,开始被相信,世界将会别开生面。
BEIJING·SHANGHAI·SHENZHEN·HONGKONG
WWW.5YCAP.COM
继续阅读
阅读原文