GGV有话说:
GGV投资笔记是 GGV纪源资本关于投资、商业、科技的所见所闻所想,探讨关于世界的一切。
在这里,你可以收获:
全球优秀科技公司管理经验、一线调研;
顶级风险投资人&创业者经验分享;
大航海时代的世界人文历史、商业见闻……
以下是 GGV投资笔记系列第一百一十五期。
口述:启元世界创始人 袁泉
编辑:张颖
2020年6月,创业公司“启元世界”给通用人工智能(Artificial General Intelligence ,即AGI)行业带来了一条重磅消息:它只用了顶尖AGI科技公司DeepMind 1%的算力,便在《星际争霸II》人机大战中以2:0的优异成绩,击败了职业冠军李培楠(TIME)。
公众视野很快集中到颇为“神秘”的这家公司身上。这家名为“启元世界”的公司似乎是含着金汤匙出生:创始人袁泉曾在阿里一手打造了全球电商最大的个性化产品“猜你喜欢”的技术体系,不仅是阿里算法团队的技术大牛,还曾在IBM中国研究院任研究员,担任ACM / IEEE等国际顶会审稿人并发表了多篇顶会论文与中美专利;CTO龙海涛曾在阿里巴巴负责搜索广告业务的架构设计,也曾是IBM研究院最年轻的科学家。
2017年创立以来,启元世界先后几次拿到高榕资本、GGV纪源资本、嘉御基金等机构的投资,也获得了莉莉丝游戏等行业资本的支持。但它创立前3年都在专心研发技术,在行业内颇为低调。创始团队从产业中来,却又“回归”技术,这是否是通用智能平台型企业的必要路线?GGV投资笔记采访了启元世界创始人袁泉,希望从他口中得到解答。
由AlphaGo打开的一扇窗
启元世界创始人袁泉戏称,虽然创业前三年手里有从天使到pre-A的上亿融资,但团队几乎只专注于“打游戏”这一件事。
实际上,那时的启元世界是在训练公司最重要的产品“通用智能体”的IQ能力。归根结底,游戏是AGI产业类平台企业首选的应用市场,也是AGI自我“训练”的最佳场所。
袁泉技术生涯最初的高光时刻并非出现在游戏行业。2006年于西安交大计算机硕士毕业之后,他进入IBM研究院,研究机器学习相关的算法,即当时十分创新的个性化推荐。当时全球互联网最流行的技术是搜索的算法和架构,他们组与美国Watson研究院同事一起将个性化推荐作为搜索之后的下一个技术热点来进行研究。也是在2006年,Netflix设立了奖金为100万美元的机器学习和数据挖掘竞赛,向全球开放了大量可以被研究使用的用户数据,他们也因此持续地依靠开放大数据去进行研究,发布了不少文章和专利。
2012年初,阿里找到袁泉,原因是看到贝索斯在亚马逊之中亲自建立了一支个性化推荐团队,依靠技术推出了网站底部的商品推荐,创造了巨大的用户与商业价值。而袁泉加入阿里,便是要帮助淘宝与天猫创办一套专业的个性化推荐体系。这令他十分兴奋:可以将学术积累的成果用在用户量巨大的电商推荐场景下,缩短用户在海量商品中的发现时间。
加拿大NeurIPS 2019,启元星际AI首次公开
当时恰是阿里巴巴提出“ALL IN无线”战略的阶段,袁泉与团队开始靠算法优化移动端用户的购物体验。转折点来自于蒋凡执掌“手机淘宝”的变化:手机淘宝的前几屏作为各部门“必争”之地,已经分成模块并被不同产品所占据了点位。但是在两三屏之后,还有一些空置的位置可进行“实验”,蒋凡的思路是放入针对用户的个性化购物推荐。从10行、两列的“猜你喜欢”开始,袁泉与团队逐渐扩大“疆域”,结合用户碎片时间刷手机的习惯,后台可以持续推送成百上千个相关产品,甚至一些“意料之外,情理之中”的新奇商品。令袁泉引以为傲的是,自己在2017年离开阿里巴巴的时候,手机淘宝“猜你喜欢”每天DAU超过一亿,超越亚马逊成为了全球最大的电商个性化推荐平台。
让袁泉决定创办一家AGI公司的源动力来自一场机器学习研讨会,那是2016年DeepMind击败李世石之后不久在纽约举办的。在会议上,AlphaGo之父David Sliver第一次分享了新一代AGI技术,以及“通用智能AGI = 深度学习+强化学习”的新范式。 
当时AGI被视作一个很新很小众, 但技术门槛和上限极高的赛道,基于通用人工智能技术的AlphaGo “智能体”第一次展示了超越人类IQ的潜力,相对于过去基于大数据的机器学习拟合模型,这是一种质变。例如, AlphaGo第一代使用了人类几千年的棋谱,而第二代只用了很少的人类棋谱,第三代AlphaZero甚至完全没有使用人类棋谱,而是让两个AI“左右互搏”去生成棋谱和对战数据,这些高质量数据将用来训练一个极其聪慧的AI神经网络,其后AI又能再生成更高质量的数据,这种螺旋式上升是通用智能AGI与上一代机器学习的一个的本质区别。
因在纽约DeepMind“打开一扇窗”所带来的震惊,以及一直以来永攀技术高峰的追求,袁泉决定在AGI赛道中开始自己的挑战。他与合伙人选择了游戏作为智能体的训练平台,并且直接将爱好变成了“工作”——让启元世界的智能体在大家最爱的游戏《星际争霸》中进行训练。日复一日地“打游戏”之余,他们发表了世界上第一篇用深度强化学习的神经网络去做星际战术博弈的的论文BICNET,并且被微软、英伟达等几十家全球机构引用。可以说,曾在电商行业依靠技术创新获得认可的袁泉已经半只脚“踏入”了游戏行业。
一举成名的《星际争霸》比赛
2017年底,启元团队在洛杉矶与DeepMind团队一起开了一次研讨会,他们聊到,如果想要用强化学习、自学习的智能体在《星际争霸》这种策略类游戏中战胜职业冠军,到底需要多久的研发周期。DeepMind团队的第一反应是需要10年,双方团队交流到技术在“指数级”进步后,DeepMind修正到要至少5年。
而事实是,2019年DeepMind击败欧洲职业冠军,同年启元世界星际AI击败国内黄金选手;次年,2020年6月份,创办3年时间的启元世界在与中国星际职业冠军TIME的对战中2:0获胜。
在游戏行业从业者的眼中,AGI是一个能够帮助他们解决关键问题的潜在手段,尤其是通用智能的自学习、泛化性,接近人脑的举一反三能力让它成为游戏和元宇宙中最有想象力的基础设施。刚刚创业时,袁泉与莉莉丝科技创始人王信文聊到自己的计划,后者立刻提到,如果让AI陪玩家打《炉石传说》、或者AI的EQ提升后陪伴人一定会很有趣。
启元世界在2021ChinaJoy现场
战胜TIME标志着启元与DeepMind成为全球唯二两家击败世界冠军的AGI厂商。当时DeepMind以AlphaStar队长的身份特意发来邮件,他们惊讶于启元能够如此快速,并且用远远少于DeepMind此前算力的条件便打败了世界冠军。在此之后,启元世界的团队行业知名度开始提升,并大力拓展从游戏到元宇宙产业中的落地场景。本着“AI for Experience“的愿景,启元世界希望AI智能体升级为能创造全新体验的“AI Being”新物种,在数字世界启发人陪伴人产生创新体验。
用游戏AI让元宇宙加速落地
2021年初,启元世界与阿里游戏的《三国志战略版》(三战)团队碰撞出不少契合点,三战是最硬核的SLG游戏(策略类游戏),融策略乐趣与社交乐趣于一体,被不少玩家称为“三国元宇宙“;启元在最复杂的星际AI中所展现的超大数值空间的探索与优化能力,以及让星际玩家眼前一亮的维京流创新玩法,正是SLG游戏所需要的。双方一拍即合,在“数百武将 x 数百战法 x多种兵书”的数值优化方案中,启元找到了超出策划团队预期的新方案;更能展现通用智能AGI优势的地方在于,如此复杂的多任务场景,启元只采用了一套AGI方案进行,这是经典机器学习所无法比拟的。
 同时,启元世界与莉莉丝科技的大规模商业化也在21年开启,双方都非常看好基于AGI的开放世界NPC,如《失控玩家》中的Free Guy,《西部世界》中的Dolores,沉浸式鲜活拟人的NPC在未来游戏与元宇宙中与人相伴相生是双方的梦想,于是双方基于莉莉丝3D FPS游戏(即第一人称视角设计游戏)《落日余晖》进行了深度合作:启元在游戏产品本身相对成型的时候介入,与莉莉丝研发团队进行对接,试图打造不同难度、不同风格、高度拟人的AI虚拟队友和虚拟对手。启元首先会引入智能体在游戏中进行训练,再将其部署在云平台上。
2020年6月,启元世界自主研发的AI智能体在《星际争霸II》人机大战中以2:0击败了中国星际职业冠军级选手,成为国内首个在公开比赛中战胜顶级职业选手的星际AI,并刷新了人机对抗的历史最高成绩。
目前,通过与阿里游戏的《三国志战略版》,莉莉丝的《末日余晖》、《万国觉醒》等等国内外标杆客户的合作,启元世界的AGI引擎能够做到明显改进游戏生态平衡性设计、提升用户留存与创新体验,让产品在设计期、冷启动期及成熟运营期,均产生体验上和商业上的价值显著提升;同时启元通用AI提供的游戏千人千面推荐服务,可将玩家购买转化率提升50%以上。
目前启元世界希望重点拓展的客户,第一类是类似《三国志战略版》的策略类游戏,第二类是类似《末日余晖》的开放世界FPS游戏,未来启元还会探索开放世界沉浸式游戏中更具交互感、IQ和EQ兼具的NPC,达到类似于电影《失控玩家》中呈现的效果,提升游戏的乐趣。
不仅如此,启元世界也在进行游戏之外的尝试。通过游戏这个可以高度仿真、加速训练的“试炼场”训练出来的智能体,将拥有越来越强的认知决策能力,从而在不久的将来被应用到社交、教育、直播等领域,甚至是产业元宇宙中。
如今启元世界已经面向游戏行业推出了全套AI Beings解决方案,平台产品包括AI Beings训练云、AI Beings推理云、AI Beings数据生成引擎等。而这个研发成果本身也成为很多研发机构的技术辅助。一些研发AGI的科研机构与高校已经在采购启元的AI Beings训练平台并展开自己的研究。
启元世界AI提供在线服务的游戏产品
莉莉丝末日余晖(Farlight84)将于2022年发布
做一家自己养活自己的AI公司
创业这几年,袁泉注意到了AI公司普遍会面临的挑战:尽管大家都拥有不错的研发基础,但是在落地的过程中需要针对场景进行大量定制化研发,换句话说,每一个新的任务都需要重新训练模型。
在袁泉看来,唯有通用人工智能这种类似于“基础设施”的设置才能解决AI企业的这一普遍困扰。启元自身就是一家专注于通用人工智能的公司,其背后的逻辑是借助智能体自我学习、自主决策的优势,以对外界复杂环境的应变决策能力更强、泛化性更高的方式识别信息,根据不同场景进行不同的落地,从而成为一个既关注技术又关注市场、与客户一同成长的研发商与服务商。这也将使启元的商业模式拥有更多选择,通过杠杆效应创造规模化。
目前启元的产品已经拥有较强的通用性:在《星际争霸》中构建的神经网络放到回合制的策略游戏中,研发团队不需要做太大的改变,智能体就可以自己去适应这种游戏。以启元团队最近交付的项目为例,游戏的场景很复杂,拥有几百张地图、几百位武将、几百个战法,传统AI技术很难用一套模型、一套算法去适配。但是启元只需要训练一套AI算法模型便能达到适配。
袁泉认为,即使是专注于技术多年的团队也需要回归到商业的本质——自己养活自己。他一向喜欢德国的足球队,并且认为德国俱乐部与英国、西班牙等国家的俱乐部不同:德国俱乐部尽管会花大价钱引入球员,但宗旨是每个赛季能够盈利,用赚到的收入去吸引更好的新秀;但英超与西甲俱乐部常常为了扩大影响力而不遗余力的购置球星,耗费大量资本。作为一家经历了疫情的创业公司来说,他更希望启元能务实一些,做好技术,做好产品,舍去浮华,自负盈亏。
如今的游戏行业已经是孕育很多新技术的基石,启元也遇到了“元宇宙”这样生逢其时的热点。袁泉希望启元的AGI技术能够成为元宇宙中的一个“认知决策大脑”。畅想未来的消费元宇宙,可能会出现《西部世界》或《阿凡达》的景象,人们通过VR设备沉浸式社交,在类似于启元的AI Beings平台中体验陪伴与陪玩的乐趣,那时候,IQ、EQ兼具的AI Beings就会是消费元宇宙中的新物种与原住民。
而面对有如此多可能性的未来,袁泉认为自己作为CEO也应当像智能体一样持续“进化”。他相信,最后能活下来的玩家也许不是那位最聪明或最强悍的,但一定是最能适应市场和环境的。
嘉宾介绍:袁泉,启元世界创始人,认知决策智能、个性化推荐领域全球产业界领军人物,前阿里巴巴资深总监、认知计算实验室负责人、淘宝、天猫推荐算法团队创始人,打造了全球电商 最大的个性化算法产品“猜你喜欢”,率团队荣获2015年阿里巴巴“双十一CEO特别贡献奖”。曾任IBM中国研究院研究员,从事机器学习相关研究,曾任ACM RecSys / KDD / IEEE on Games审稿人并发表多篇顶会论文与中美专利。
继续阅读
阅读原文