撰文 | 新皮层小组
编辑 | 王杰夫
本周最受关注的AI新闻自然是围绕OpenAI产生的一系列人事风波。
自上周六CEO Sam Altman被董事会突然罢免后,不到一周时间内,各种事件轮番上演:OpenAI另一位创始人Greg Brockman辞职;换了两位临时CEO;Altman即将加入微软;770位员工中有743位辞职抗议;投资人不满董事会;最终董事会重组,Altman回归。具体发生的事件太多,于是新皮层按照发生的时间顺序将它们整理成了时间线图,正文可见。
闹剧告一段落,但当我们探究这起风波背后的原因时,才发现背后的矛盾存在已久——要AI安全还是要商业效率。绝大多数商业公司的掌舵者来说毫无疑问会选择后者,毕竟芝加哥经济学派领军人物米尔顿·弗里德曼那句「CEO们应该完全专注于企业利润最大化」早已深入人心。
但OpenAI不一样,它的诞生本身就源于对技术巨头(当时其假想敌是Google)垄断AI技术的恐惧。2015年Sam Altman、Greg Brockman、马斯克等人共同成立了一个非营利性质的机构来研究AI,也就是OpenAI。「广泛分布的利益、长期安全、技术领先、合作导向」这四大原则至今依旧写在OpenAI的章程上,你随时可以打开网页查看。(https://openai.com/charter)
在研究中OpenAI发现了大模型技术路线的潜力,即只要向模型投喂足够数量(约500亿参数)的数据,模型就会涌现出之前不具有的能力,如语意理解、逻辑推理、代码生成等,迈向通用人工智能(AGI)的大门已经打开了一条缝隙。但是训练这样一个庞大的模型价格不菲,数十亿美元也只是入场券而已。
无论是为了开发更强大的AI,还是为了控制更强大的AI,想要继续研究就不得不引入投资推进商业化,但过快的商业化会导致强大的AI已经出现,控制AI的能力却没跟上。这就是OpenAI的两难,《大西洋月刊》的报道显示,ChatGPT推出后,OpenAI的商业化节奏越来越快,很多原本负责AI安全的人手不得已要去为快速上线的新产品擦屁股,关于AI安全的焦虑与日俱增。最终一个强大到令人不安的模型点燃了这个火药桶,它被称为Q*(发音为「Q-Star」)。Altman与Brockman想要将该技术集成到新产品中,首席科学家Ilya Sutskever和另一些关注AI安全的研究人员则持相反态度,后面发生的故事就演绎成了此次风波。
支持Sam Altman观点的人认为(想必也是绝大多数人的观点,至少从Altman最终回归就能看出),技术产生的问题,最终还是要通过技术发展来解决,而商业就是推进技术发展最好的手段,工业革命后人类技术几百年的发展似乎都印证了这一点。不过在反对派看来,AI与其他技术根本上的不同在于,它不仅仅是一个工具,AI一旦有了超越人类的智力,就具备了主观能动性。北京大学人工智能研究院副院长黄铁军就说过,按照今天的发展速度AGI将很快到来,然而我们并没有很好的办法去控制它。他引用了阿什比定律(Ashby's Law),「任何有效的控制系统都必须与它所控制的系统一样复杂」,认为人类无法控制更复杂的AI。
除了OpenAI的风波,本周亚马逊、Meta,以及国内的阿里巴巴都对AI研发业务的组织架构做了调整,其中阿里巴巴对阿里云的调整规模最大,原本要分拆并独立上市的阿里云不仅暂停分拆,阿里巴巴集团还进一步加强了对阿里云的管理,两位集团合伙人未来将参与到阿里云的业务中。
可以看出,各家公司都在竭尽所能地将资源集中到生成式AI上。在通向AGI的道路上,每家公司只有放弃而没有放缓,OpenAI打开的潘多拉魔盒已经关不上了。
以下内容由新皮层团队制作。
Key Points
OpenAI风波篇
Sam Altman重返OpenAI担任CEO;
Sam Altman被罢免或许与秘密开发Q*模型有关。
组织架构调整篇
亚马逊Alexa部门裁员,生成式AI成为重点业务;
Meta解散Responsible AI团队;
阿里云调整组织架构,公共云和AI成为重点。
大模型篇
Anthropic发布Claude 2.1,拥有目前最长的上下文长度;
估值40亿美元的Inflection推出了第二代大语言模型,声称性能仅次于GPT-4;
继Phi-2后,微软又推出一款小模型Orca 2;
DeepMind推出能玩多款棋牌游戏的模型——Student of Games。
OpenAI风波篇
Sam Altman重返OpenAI担任CEO
北京时间上周五晚,OpenAI CEO Sam Altman突然被董事会解雇,总裁Greg Brockman虽保留运营职位,但也被解除了董事会主席一职。但董事会明显低估了Altman对于OpenAI的重要性,在大批员工与投资人的支持下,Altman与董事会展开多轮谈判。5天来此事反转不断,今天,这场风波似乎终于迎来了终点——Sam Altman将重返公司担任CEO,总裁Brockman也将重返公司,董事会也将重组。
此前OpenAI董事会由6人组成,分别是CEO Sam Altman、总裁Greg Brockman、首席科学家Ilya Sutskever,以及Quora联合创始人Adam D’Angelo、技术企业家Tasha McCauley、乔治城大学安全与新兴技术中心的Helen Toner——后4人共同罢免了Altman与Brockman。
重组后的董事会人数缩减到3人,只有D‘Angelo保留下来,McCauley与Toner出局, Salesforce前首席执行官Bret Taylor、美国前财政部长Larry Summers加入,Taylor将担任董事会主席。有传言称最大外部投资人微软也试图在董事会争得一到两个席位。我们整理了这次OpenAI风波的时间线:
Sam Altman被罢免或许与秘密开发Q*模型有关
随着本周三Sam Altman回归OpenAI,这场持续多日的人事闹剧终于告一段落,但有一个关键的问题还没有得到回答,那就是为何首席科学家Ilya Sutskever会在董事会罢免Altman时投出关键性的一票?
OpenAI神秘模型Q*
近两日多家媒体透露,其中的关键原因可能是Q*的模型,它是研发人员Jakub Pachocki和Szymon Sidor基于Sutskever的研究开发出来的,时间约在今年上半年。
多年来,Sutskever希望让模型拥有人类一样从简单规则开始自学推理的能力。于是2021年他启动了一个名为 GPT-Zero的项目,用以致敬向DeepMind的 AlphaZero——它是广为人知的围棋AI AlphaGo的升级版,能通过机器与机器的对弈自我学习。
相比于现有的其他大模型,Q*最大的特点在于有着小学水平的数学能力。由于以GPT为代表的大语言模型本质上是根据数据关联性预测后续输出文字,这使得它在面对复杂的数学问题时会因为缺少数据材料而束手无策。而能够自学(而非通过投喂的数据学习)的Q*,很可能是OpenAI在对通用人工智能(AGI)的探索上的重要突破。
罢免事件仍然疑云密布
11月16日,Altman在亚太经合组织工商界领导人峰会(CEO SUMMIT)上曾暗示OpenAI在开发更强大的GPT-4的「继任者」方面取得了进展,「在开放人工智能的历史上,有4次——最近的一次是在过去的几个星期里——当我们揭开无知的面纱,向前探索发现的前沿时,我就在房间里」。
OpenAI内部对于Q*模型的态度呈两极分化。OpenAI总裁Greg Brockman一直想要将该技术集成到新产品中,这也得到了CEO Sam Altman的支持;Sutskever和另一些关注AI安全的研究人员则持相反态度。
路透社和The Information称,就在Altman被罢免前不久,部分心怀担忧的研究人员联合起来向董事会写信警告了这件事,这也成为Altman与Brockman下课的导火索。但The Verge援引一位知情人士消息称董事会并没有收到过这封信。
彭博社称,Altman已经同意对导致他被解雇的行为展开内部调查。让子弹再飞一会儿。
参考链接
https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/
https://www.theinformation.com/articles/openai-made-an-ai-breakthrough-before-altman-firing-stoking-excitement-and-concern
组织架构调整篇
亚马逊Alexa部门裁员,生成式AI成为重点业务
11月17日,亚马逊智能语音助理Alexa业务宣布裁员数百人。亚马逊表示,将投入更多资源优先发展生成式AI业务。负责Alexa和Fire TV业务的副总裁Daniel Rausch表示,公司将停止部分项目的运转并裁员数百人,具体细节目前暂未公布。
亚马逊的Alexa业务
Alexa是亚马逊在2014年推出的一款智能助理,最初用于Amazon Echo智能音箱。Alexa可以与用户语音交互,并有播放音乐、播客、有声读物,以及提供天气、交通、体育和实时新闻等功能。
虽然过去近10年间,Alexa设备以及接入Alexa的设备已接近10亿台,但在大模型时代,Alexa更像是一个「开关」,作为「助手」它已经没有那么智能了。
今年9月,亚马逊表示将在Alexa内部引入生成式AI功能,比如用户可以要求Alexa作诗、编故事,或总结新闻事件。
亚马逊的生成式AI战略
与硅谷的大型技术公司相比,亚马逊的生成式AI业务略显滞后。
·今年2月,亚马逊表示正在加强与AI初创公司Hugging Face的合作。
·4月,亚马逊发布生成式AI服务Bedrock,用户除了可以使用亚马逊自研语言大模型,还可以接入Stable Diffusion等外部模型。
·5月,有消息称亚马逊正在秘密研发其家用机器人Astro的升级版,该机器人将拥有类似ChatGPT的功能。
·6月,亚马逊成立生成式AI创新中心,帮助客户构建和部署生成式AI的定制化解决方案。
·7月,亚马逊推出Amazon Bedrock的代理(Agents)功能,AI可以帮助使用者处理复杂的工作,更接近一名助理,而不仅仅负责聊天。
·8月,亚马逊组建新的AI团队,原本负责智能助手Alexa的高级副总裁兼首席科学家Rohit Prasad被提拔,直接负责运营AI团队。
·9月,亚马逊与人工智能初创公司Anthropic达成投资协议,表示将投资近40亿美元,并以其中的12.5亿美元作为初期投资购买少数股权。
·11月,亚马逊表示正在开发新的生成式AI对话模型,试图在向企业客户销售此类软件时赶上OpenAI和微软,新的大模型代号为「Olympus」,预计将在12月推出。
参考链接
https://www.cnbc.com/2023/11/17/amazon-cuts-several-hundred-jobs-in-alexa-division.html
Meta将AI安全团队并入生成式AI团队
11月19日,Meta宣布解散Responsible AI(RAI)团队,其中大部分成员将转去Meta今年2月组建的生成式AI产品团队工作,其他成员将负责Meta的AI基础设施。
Responsible AI团队是什么?
Meta于2019年正式组建RAI,包括研究人员、数据科学家、工程师、产品经理和政策专家等有40余名成员,由Meta前高管Joaquin Quiñonero Candela领导这项工作。该团队旨在创建「公平和包容」的人工智能工具与模型,主要负责监督公司内部人工智能技术的道德与安全开发。
今年RAI已经历过重组
RAI原领导者Candela在2021年离开Meta,而伴随着原首席技术官Mike Schroepfer、原人工智能副总裁 Jérôme Pesenti等其他高管的离职,RAI在2023年颇为动荡。
去年,在Esteban Arcaute接管RAI后,该团队并入Meta的社会影响团队,其业务优先级降低。而在今年10月,RAI大部分员工已被裁员,主要集中在产品设计、用户体验以及用户和政策研究等岗位。当时内部人士表示RAI「已经是一个空壳」。
本次团队解散标志着Meta的战略重心转向生成式AI产品研发。2023年,Meta投入大量资金与资源构建生成式AI模型,如Llama 2,与OpenAI和Google展开竞争。
参考链接
https://www.theinformation.com/articles/meta-breaks-up-its-responsible-ai-team
阿里云调整组织架构,公共云和AI成为重点

11月23日,阿里云宣布了新的组织架构调整,涉及产研线、商业线、供应链等在内的8个部门。其中,商业化层面新增公共云业务事业部和混合云业务事业部。
此外,阿里巴巴在集团层面成立新的基础设施委员会,由吴泳铭统筹管理,重点协调全集团底层技术基础设施的规划与建设。新的基础设施委员会成员包括阿里云CTO周靖人、阿里合伙人蒋江伟、阿里巴巴CTO吴泽明以及阿里云原总裁张建锋。
具体的变化有这些:
·商业化层面:阿里云新成立两个事业部,刘伟光负责的公共云业务事业部,以及李津负责的混合云业务事业部。加上已有的、由袁千负责的海外业务事业部,3个事业部都向吴泳铭汇报。
·公共云业务事业部的目标将是规模优先,扩大市场占有率。而混合云业务事业部主要以满足一些特定行业因政策限制、短期无法使用公共云的客户需求,目标是侧重利润,在减少项目制的软硬件订单销售的同时,鼓励政企客户优先使用公共云。
·产研层面:阿里云成立了基础设施事业部和产品架构与稳定性部,分别由阿里合伙人蒋江伟和重回阿里云的唐洪负责,两人都向阿里云CTO周靖人汇报。
·管理层面:阿里巴巴集团将主要通过阿里合伙人参与到阿里云的管理中。阿里合伙人王磊将负责阿里云供应链、官网、服务、信息技术和系统(CIO)等部门,阿里合伙人兼阿里云智能集团CFO郑俊芳将负责商业智能(BI)、战略投资、销管、价格管理等部门。
阿里云暂停上市,加强公共云投入
阿里巴巴11月16日发布新季度财报时,宣布不再分拆阿里云。对此它给出的解释是,美国扩大芯片出口管制给云智能集团的前景带来不确定性。
今年3月,阿里巴巴宣布启动「1+6+N」组织架构调整,在集团旗下设立阿里云智能、淘宝天猫商业、本地生活、国际数字商业、菜鸟、大文娱等6个业务集团和多家业务公司。阿里巴巴原计划在一年内完成阿里云智能的分拆上市,这一计划目前已终止。
而在具体的战略上,阿里云重点加强了公共云和AI。吴泳铭在上个季度发布的公开信中表示,阿里云将坚持「AI驱动、公共云优先」。「AI驱动」指的是阿里云的目标是「AI时代最开放的云」,为客户提供稳定高效的AI基础设施;「公共云优先」指的是阿里云对所有产品和业务模式做取舍,减少项目制销售订单,加大对公共云核心产品的投入。
上个季度,阿里云同比增长2%至276.5亿元,获利同比增长44%至14.1亿元,是阿里巴巴各个板块中增速最慢的。
参考链接
https://www.eeo.com.cn/2023/1123/614938.shtml
组织架构调整篇
Anthropic发布Claude 2.1,拥有目前最长的上下文长度
OpenAI经历「换帅」风波时,其竞争对手的研发又有了进展。11月21日,Anthropic在官网发布大模型Claude 2.1,这是对现有大模型Claude 2的升级。
Claude 2.1有哪些更新?
·200K的上下文窗口:这是本次升级最显著的更新,Claude 2.1拥有200K tokens的上下文窗口,已经超越了GPT-4 Turbo的128K tokens,成为业界第一。Claude 2.1现在可以处理超过500页的材料,用户可以上传整个代码库、财务报表,甚至是《伊利亚特》《奥德赛》等文学作品,Claude 2.1能够与上述内容交互,完成问答、总结、预测趋势等任务。
·幻觉率降低两倍:Claude 2.1在诚实性方面也取得了显著进步,与Claude 2.0相比,Claude 2.1的幻觉率减少了两倍。技术团队设计了大量复杂的事实问题测试Claude 2.1的诚实性,这让Claude 2.1更有可能提出异议,而不是提供错误信息。企业因此可以构建高性能的AI应用程序,解决具体的业务问题。
·理解与总结能力提升:最新评估显示,在处理高精度的复杂文档例如法律文件、财务报告和技术规范上,Claude 2.1提供错误答案的概率较之前减少了30%,错误地总结文档以支持观点的概率也降低了3到4倍。
·使用API工:这是一个新的测试功能,开发者可以通过API与大模型Claude 2.1交互,将其集成到自己的应用程序与流程中。
Claude 2.1可以在哪里用到?
Claude 2.1现在可以通过API中使用,也可以通过网页端访问。不过200K tokens的上下文窗口仅限Claude Pro用户使用。Anthropic在官网提到,将努力构建行业中最安全、技术最复杂的AI系统。
参考链接
https://www.anthropic.com/index/claude-2-1
估值40亿美元的Inflection推出了第二代大语言模型,声称性能仅次于GPT-4
11月22日,美国AI初创公司Inflection宣布完成大语言模型Inflection-2的训练。Inflection公司表示,相比今年6月发布的Inflection-1,Inflection-2展现了事实知识的提升、更好的文体控制以及显著改进的推理能力,在多项测试中其表现仅次于GPT-4。Inflection-2将很快集成到Inflection开发的聊天机器人Pi中。
豪华的创始团队和投资人
新皮层曾经介绍过Inflection公司和它的创始团队。2022年3月组建的Inflection公司,创始人分别是DeepMind联合创始人Mustafa Suleyman、DeepMind原首席科学家Karen Simonyan和LinkedIn联合创始人里德·霍夫曼。
创立以来,这家公司已经完成了超过15亿美元的融资,投资方包括微软、英伟达、Google前CEO埃里克·施密特等。Inflection公司的核心产品聊天机器人Pi主打的不是生产力工具,而是面向个人用户的、带情感的聊天伙伴。此外,Inflection公司也面向少量合作方提供API产品。Suleyman没有公布今年5月上市的Pi的用户量,只表示「它非常受欢迎,留存率很高」。
新模型的训练已经提上日程,规模要大100倍
Inflection与英伟达、云计算服务公司CoreWeave合作开发、集成了2.2万枚H100芯片的计算集群或许是其最重要的资产,它超过了Meta此前公布的由1.6万块GPU组成的集群。Inflection公司表示,计划全量使用这个2.2万枚H100芯片构成的集群训练更大规模的模型。
Suleyman称,预计下一个模型的规模将在6个月内达到前代模型的10倍,并在后续6个月的时间里继续10倍成长——也就是模型规模在未来一年内扩大100倍。
参考链接
https://inflection.ai/inflection-2
https://www.forbes.com/sites/alexkonrad/2023/11/22/inflection-ai-releases-2nd-model-on-gpt-4-heels/
DeepMind推出能玩多款棋牌游戏的模型——Student of Games
刊登在《科学进展》期刊上的最新论文显示,DeepMind开发出了一种名为Student of Games(SoG)的新AI,可以在国际象棋、围棋、扑克和其他需要多种策略才能获胜的游戏中击败人类玩家。
SoG结合了两种AI
科学杂志《新科学人》采访到了论文作者之一、曾在DeepMind公司从事AI工作的Martin Schmid,他目前已经离开DeepMind,在一家名为EquiLibre Technologies的初创公司工作。
Schmid表示,SoG模型可以追溯到两个项目,其一是由Schmid等人在加拿大阿尔伯塔大学读书时开发的AI DeepStack,它是首个在扑克游戏中击败人类职业玩家的AI;其二是DeepMind公司开发的AlphaZero,它在国际象棋和围棋等游戏中击败了最优秀的人类棋手。
这两种AI模型的区别在于,一种专注于不完美知识游戏,即玩家不知道其他玩家的状态;另一种专注于完美知识游戏,例如国际象棋,玩家可以随时看到双方所有棋子的位置,因而两者需要根本不同的方法。DeepMind聘请了整个DeepStack团队,合作开发一种可以泛化两种类型游戏的模型,也就是现在的SoG。
最初,SoG作为学习游戏策略的「蓝图」,通过练习持续改进。而后,这个入门模型可以在不同的游戏中自由发挥,并训练自己与自己的另一个版本对战,学习新策略并逐渐提升性能。
相比之下,DeepMind旗下的AlphaZero只适应围棋这样的完美知识游戏,SoG则可以同时适应完美和不完美知识游戏,因而具有更强的通用性,但在特定游戏的性能方面相对弱于AlphaZero。
DeepMind开发了这些游戏AI
·2017年10月,开发AlphaZero,不采用人类玩家的棋谱,而是通过自我对弈,超越了AlphaGo Lee、AlphaGo Master等旧版本;
·2019年1月,开发AlphaStar,在《星际争霸2》击败了职业选手TLO、MaNa;
·2020年12月,开发MuZero,在不告知游戏规则的情况下,让它通过观察大量游戏和棋类比赛来掌握围棋、国际象棋、日本将棋等规则,在国际象棋、围棋和日本将棋上达到了与接收过完善规则的AlphaGo相同的水平。
参考链接
https://www.science.org/doi/10.1126/sciadv.adg3256
-END-
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的智能,不只是 AI。
若想了解更多本周资讯,请点击阅读往期智能周报:
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
本文版权归第一财经所有,
未经许可不得转载或翻译。
识别下图二维码,
即可购买《第一财经》杂志2023年11月刊
继续阅读
阅读原文