智能周报｜Sam Altman重返OpenAI担任CEO，当初被罢免或许与秘密开发Q*模型有关；亚马逊Alexa部门裁员….

撰文 | 新皮层小组

编辑 | 王杰夫

本周最受关注的AI新闻自然是围绕OpenAI产生的一系列人事风波。

自上周六CEO Sam Altman被董事会突然罢免后，不到一周时间内，各种事件轮番上演：OpenAI另一位创始人Greg Brockman辞职；换了两位临时CEO；Altman即将加入微软；770位员工中有743位辞职抗议；投资人不满董事会；最终董事会重组，Altman回归。具体发生的事件太多，于是新皮层按照发生的时间顺序将它们整理成了时间线图，正文可见。

闹剧告一段落，但当我们探究这起风波背后的原因时，才发现背后的矛盾存在已久——要AI安全还是要商业效率。绝大多数商业公司的掌舵者来说毫无疑问会选择后者，毕竟芝加哥经济学派领军人物米尔顿·弗里德曼那句「CEO们应该完全专注于企业利润最大化」早已深入人心。

但OpenAI不一样，它的诞生本身就源于对技术巨头（当时其假想敌是Google）垄断AI技术的恐惧。2015年Sam Altman、Greg Brockman、马斯克等人共同成立了一个非营利性质的机构来研究AI，也就是OpenAI。「广泛分布的利益、长期安全、技术领先、合作导向」这四大原则至今依旧写在OpenAI的章程上，你随时可以打开网页查看。（https://openai.com/charter）

在研究中OpenAI发现了大模型技术路线的潜力，即只要向模型投喂足够数量（约500亿参数）的数据，模型就会涌现出之前不具有的能力，如语意理解、逻辑推理、代码生成等，迈向通用人工智能（AGI）的大门已经打开了一条缝隙。但是训练这样一个庞大的模型价格不菲，数十亿美元也只是入场券而已。

无论是为了开发更强大的AI，还是为了控制更强大的AI，想要继续研究就不得不引入投资推进商业化，但过快的商业化会导致强大的AI已经出现，控制AI的能力却没跟上。这就是OpenAI的两难，《大西洋月刊》的报道显示，ChatGPT推出后，OpenAI的商业化节奏越来越快，很多原本负责AI安全的人手不得已要去为快速上线的新产品擦屁股，关于AI安全的焦虑与日俱增。最终一个强大到令人不安的模型点燃了这个火药桶，它被称为Q*（发音为「Q-Star」）。Altman与Brockman想要将该技术集成到新产品中，首席科学家Ilya Sutskever和另一些关注AI安全的研究人员则持相反态度，后面发生的故事就演绎成了此次风波。

支持Sam Altman观点的人认为（想必也是绝大多数人的观点，至少从Altman最终回归就能看出），技术产生的问题，最终还是要通过技术发展来解决，而商业就是推进技术发展最好的手段，工业革命后人类技术几百年的发展似乎都印证了这一点。不过在反对派看来，AI与其他技术根本上的不同在于，它不仅仅是一个工具，AI一旦有了超越人类的智力，就具备了主观能动性。北京大学人工智能研究院副院长黄铁军就说过，按照今天的发展速度AGI将很快到来，然而我们并没有很好的办法去控制它。他引用了阿什比定律（Ashby's Law），「任何有效的控制系统都必须与它所控制的系统一样复杂」，认为人类无法控制更复杂的AI。

除了OpenAI的风波，本周亚马逊、Meta，以及国内的阿里巴巴都对AI研发业务的组织架构做了调整，其中阿里巴巴对阿里云的调整规模最大，原本要分拆并独立上市的阿里云不仅暂停分拆，阿里巴巴集团还进一步加强了对阿里云的管理，两位集团合伙人未来将参与到阿里云的业务中。

可以看出，各家公司都在竭尽所能地将资源集中到生成式AI上。在通向AGI的道路上，每家公司只有放弃而没有放缓，OpenAI打开的潘多拉魔盒已经关不上了。

以下内容由新皮层团队制作。

Key Points

OpenAI风波篇

Sam Altman重返OpenAI担任CEO；

Sam Altman被罢免或许与秘密开发Q*模型有关。

组织架构调整篇

亚马逊Alexa部门裁员，生成式AI成为重点业务；

Meta解散Responsible AI团队；

阿里云调整组织架构，公共云和AI成为重点。

大模型篇

Anthropic发布Claude 2.1，拥有目前最长的上下文长度；

估值40亿美元的Inflection推出了第二代大语言模型，声称性能仅次于GPT-4；

继Phi-2后，微软又推出一款小模型Orca 2；

DeepMind推出能玩多款棋牌游戏的模型——Student of Games。

OpenAI风波篇

Sam Altman重返OpenAI担任CEO

北京时间上周五晚，OpenAI CEO Sam Altman突然被董事会解雇，总裁Greg Brockman虽保留运营职位，但也被解除了董事会主席一职。但董事会明显低估了Altman对于OpenAI的重要性，在大批员工与投资人的支持下，Altman与董事会展开多轮谈判。5天来此事反转不断，今天，这场风波似乎终于迎来了终点——Sam Altman将重返公司担任CEO，总裁Brockman也将重返公司，董事会也将重组。

此前OpenAI董事会由6人组成，分别是CEO Sam Altman、总裁Greg Brockman、首席科学家Ilya Sutskever，以及Quora联合创始人Adam D’Angelo、技术企业家Tasha McCauley、乔治城大学安全与新兴技术中心的Helen Toner——后4人共同罢免了Altman与Brockman。

重组后的董事会人数缩减到3人，只有D‘Angelo保留下来，McCauley与Toner出局， Salesforce前首席执行官Bret Taylor、美国前财政部长Larry Summers加入，Taylor将担任董事会主席。有传言称最大外部投资人微软也试图在董事会争得一到两个席位。我们整理了这次OpenAI风波的时间线：

Sam Altman被罢免或许与秘密开发Q*模型有关

随着本周三Sam Altman回归OpenAI，这场持续多日的人事闹剧终于告一段落，但有一个关键的问题还没有得到回答，那就是为何首席科学家Ilya Sutskever会在董事会罢免Altman时投出关键性的一票？

OpenAI神秘模型Q*

近两日多家媒体透露，其中的关键原因可能是Q*的模型，它是研发人员Jakub Pachocki和Szymon Sidor基于Sutskever的研究开发出来的，时间约在今年上半年。

多年来，Sutskever希望让模型拥有人类一样从简单规则开始自学推理的能力。于是2021年他启动了一个名为 GPT-Zero的项目，用以致敬向DeepMind的 AlphaZero——它是广为人知的围棋AI AlphaGo的升级版，能通过机器与机器的对弈自我学习。

相比于现有的其他大模型，Q*最大的特点在于有着小学水平的数学能力。由于以GPT为代表的大语言模型本质上是根据数据关联性预测后续输出文字，这使得它在面对复杂的数学问题时会因为缺少数据材料而束手无策。而能够自学（而非通过投喂的数据学习）的Q*，很可能是OpenAI在对通用人工智能（AGI）的探索上的重要突破。

罢免事件仍然疑云密布

11月16日，Altman在亚太经合组织工商界领导人峰会（CEO SUMMIT）上曾暗示OpenAI在开发更强大的GPT-4的「继任者」方面取得了进展，「在开放人工智能的历史上，有4次——最近的一次是在过去的几个星期里——当我们揭开无知的面纱，向前探索发现的前沿时，我就在房间里」。

OpenAI内部对于Q*模型的态度呈两极分化。OpenAI总裁Greg Brockman一直想要将该技术集成到新产品中，这也得到了CEO Sam Altman的支持；Sutskever和另一些关注AI安全的研究人员则持相反态度。

路透社和The Information称，就在Altman被罢免前不久，部分心怀担忧的研究人员联合起来向董事会写信警告了这件事，这也成为Altman与Brockman下课的导火索。但The Verge援引一位知情人士消息称董事会并没有收到过这封信。

彭博社称，Altman已经同意对导致他被解雇的行为展开内部调查。让子弹再飞一会儿。

参考链接

https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/

https://www.theinformation.com/articles/openai-made-an-ai-breakthrough-before-altman-firing-stoking-excitement-and-concern

组织架构调整篇

亚马逊Alexa部门裁员，生成式AI成为重点业务

11月17日，亚马逊智能语音助理Alexa业务宣布裁员数百人。亚马逊表示，将投入更多资源优先发展生成式AI业务。负责Alexa和Fire TV业务的副总裁Daniel Rausch表示，公司将停止部分项目的运转并裁员数百人，具体细节目前暂未公布。

亚马逊的Alexa业务

Alexa是亚马逊在2014年推出的一款智能助理，最初用于Amazon Echo智能音箱。Alexa可以与用户语音交互，并有播放音乐、播客、有声读物，以及提供天气、交通、体育和实时新闻等功能。

虽然过去近10年间，Alexa设备以及接入Alexa的设备已接近10亿台，但在大模型时代，Alexa更像是一个「开关」，作为「助手」它已经没有那么智能了。

今年9月，亚马逊表示将在Alexa内部引入生成式AI功能，比如用户可以要求Alexa作诗、编故事，或总结新闻事件。

亚马逊的生成式AI战略

与硅谷的大型技术公司相比，亚马逊的生成式AI业务略显滞后。

·今年2月，亚马逊表示正在加强与AI初创公司Hugging Face的合作。

·4月，亚马逊发布生成式AI服务Bedrock，用户除了可以使用亚马逊自研语言大模型，还可以接入Stable Diffusion等外部模型。

·5月，有消息称亚马逊正在秘密研发其家用机器人Astro的升级版，该机器人将拥有类似ChatGPT的功能。

·6月，亚马逊成立生成式AI创新中心，帮助客户构建和部署生成式AI的定制化解决方案。

·7月，亚马逊推出Amazon Bedrock的代理（Agents）功能，AI可以帮助使用者处理复杂的工作，更接近一名助理，而不仅仅负责聊天。

·8月，亚马逊组建新的AI团队，原本负责智能助手Alexa的高级副总裁兼首席科学家Rohit Prasad被提拔，直接负责运营AI团队。

·9月，亚马逊与人工智能初创公司Anthropic达成投资协议，表示将投资近40亿美元，并以其中的12.5亿美元作为初期投资购买少数股权。

·11月，亚马逊表示正在开发新的生成式AI对话模型，试图在向企业客户销售此类软件时赶上OpenAI和微软，新的大模型代号为「Olympus」，预计将在12月推出。

参考链接

https://www.cnbc.com/2023/11/17/amazon-cuts-several-hundred-jobs-in-alexa-division.html

Meta将AI安全团队并入生成式AI团队

11月19日，Meta宣布解散Responsible AI（RAI）团队，其中大部分成员将转去Meta今年2月组建的生成式AI产品团队工作，其他成员将负责Meta的AI基础设施。

Responsible AI团队是什么？

Meta于2019年正式组建RAI，包括研究人员、数据科学家、工程师、产品经理和政策专家等有40余名成员，由Meta前高管Joaquin Quiñonero Candela领导这项工作。该团队旨在创建「公平和包容」的人工智能工具与模型，主要负责监督公司内部人工智能技术的道德与安全开发。

今年RAI已经历过重组

RAI原领导者Candela在2021年离开Meta，而伴随着原首席技术官Mike Schroepfer、原人工智能副总裁 Jérôme Pesenti等其他高管的离职，RAI在2023年颇为动荡。

去年，在Esteban Arcaute接管RAI后，该团队并入Meta的社会影响团队，其业务优先级降低。而在今年10月，RAI大部分员工已被裁员，主要集中在产品设计、用户体验以及用户和政策研究等岗位。当时内部人士表示RAI「已经是一个空壳」。

本次团队解散标志着Meta的战略重心转向生成式AI产品研发。2023年，Meta投入大量资金与资源构建生成式AI模型，如Llama 2，与OpenAI和Google展开竞争。

参考链接

https://www.theinformation.com/articles/meta-breaks-up-its-responsible-ai-team

阿里云调整组织架构，公共云和AI成为重点

11月23日，阿里云宣布了新的组织架构调整，涉及产研线、商业线、供应链等在内的8个部门。其中，商业化层面新增公共云业务事业部和混合云业务事业部。

此外，阿里巴巴在集团层面成立新的基础设施委员会，由吴泳铭统筹管理，重点协调全集团底层技术基础设施的规划与建设。新的基础设施委员会成员包括阿里云CTO周靖人、阿里合伙人蒋江伟、阿里巴巴CTO吴泽明以及阿里云原总裁张建锋。

具体的变化有这些：

·商业化层面：阿里云新成立两个事业部，刘伟光负责的公共云业务事业部，以及李津负责的混合云业务事业部。加上已有的、由袁千负责的海外业务事业部，3个事业部都向吴泳铭汇报。

·公共云业务事业部的目标将是规模优先，扩大市场占有率。而混合云业务事业部主要以满足一些特定行业因政策限制、短期无法使用公共云的客户需求，目标是侧重利润，在减少项目制的软硬件订单销售的同时，鼓励政企客户优先使用公共云。

·产研层面：阿里云成立了基础设施事业部和产品架构与稳定性部，分别由阿里合伙人蒋江伟和重回阿里云的唐洪负责，两人都向阿里云CTO周靖人汇报。

·管理层面：阿里巴巴集团将主要通过阿里合伙人参与到阿里云的管理中。阿里合伙人王磊将负责阿里云供应链、官网、服务、信息技术和系统（CIO）等部门，阿里合伙人兼阿里云智能集团CFO郑俊芳将负责商业智能（BI）、战略投资、销管、价格管理等部门。

阿里云暂停上市，加强公共云投入

阿里巴巴11月16日发布新季度财报时，宣布不再分拆阿里云。对此它给出的解释是，美国扩大芯片出口管制给云智能集团的前景带来不确定性。

今年3月，阿里巴巴宣布启动「1+6+N」组织架构调整，在集团旗下设立阿里云智能、淘宝天猫商业、本地生活、国际数字商业、菜鸟、大文娱等6个业务集团和多家业务公司。阿里巴巴原计划在一年内完成阿里云智能的分拆上市，这一计划目前已终止。

而在具体的战略上，阿里云重点加强了公共云和AI。吴泳铭在上个季度发布的公开信中表示，阿里云将坚持「AI驱动、公共云优先」。「AI驱动」指的是阿里云的目标是「AI时代最开放的云」，为客户提供稳定高效的AI基础设施；「公共云优先」指的是阿里云对所有产品和业务模式做取舍，减少项目制销售订单，加大对公共云核心产品的投入。

上个季度，阿里云同比增长2%至276.5亿元，获利同比增长44%至14.1亿元，是阿里巴巴各个板块中增速最慢的。

参考链接

https://www.eeo.com.cn/2023/1123/614938.shtml

组织架构调整篇

Anthropic发布Claude 2.1，拥有目前最长的上下文长度

OpenAI经历「换帅」风波时，其竞争对手的研发又有了进展。11月21日，Anthropic在官网发布大模型Claude 2.1，这是对现有大模型Claude 2的升级。

Claude 2.1有哪些更新？

·200K的上下文窗口：这是本次升级最显著的更新，Claude 2.1拥有200K tokens的上下文窗口，已经超越了GPT-4 Turbo的128K tokens，成为业界第一。Claude 2.1现在可以处理超过500页的材料，用户可以上传整个代码库、财务报表，甚至是《伊利亚特》《奥德赛》等文学作品，Claude 2.1能够与上述内容交互，完成问答、总结、预测趋势等任务。

·幻觉率降低两倍：Claude 2.1在诚实性方面也取得了显著进步，与Claude 2.0相比，Claude 2.1的幻觉率减少了两倍。技术团队设计了大量复杂的事实问题测试Claude 2.1的诚实性，这让Claude 2.1更有可能提出异议，而不是提供错误信息。企业因此可以构建高性能的AI应用程序，解决具体的业务问题。

·理解与总结能力提升：最新评估显示，在处理高精度的复杂文档例如法律文件、财务报告和技术规范上，Claude 2.1提供错误答案的概率较之前减少了30%，错误地总结文档以支持观点的概率也降低了3到4倍。

·使用API工具：这是一个新的测试功能，开发者可以通过API与大模型Claude 2.1交互，将其集成到自己的应用程序与流程中。

Claude 2.1可以在哪里用到？

Claude 2.1现在可以通过API中使用，也可以通过网页端访问。不过200K tokens的上下文窗口仅限Claude Pro用户使用。Anthropic在官网提到，将努力构建行业中最安全、技术最复杂的AI系统。

参考链接

https://www.anthropic.com/index/claude-2-1

估值40亿美元的Inflection推出了第二代大语言模型，声称性能仅次于GPT-4

11月22日，美国AI初创公司Inflection宣布完成大语言模型Inflection-2的训练。Inflection公司表示，相比今年6月发布的Inflection-1，Inflection-2展现了事实知识的提升、更好的文体控制以及显著改进的推理能力，在多项测试中其表现仅次于GPT-4。Inflection-2将很快集成到Inflection开发的聊天机器人Pi中。

豪华的创始团队和投资人

新皮层曾经介绍过Inflection公司和它的创始团队。2022年3月组建的Inflection公司，创始人分别是DeepMind联合创始人Mustafa Suleyman、DeepMind原首席科学家Karen Simonyan和LinkedIn联合创始人里德·霍夫曼。

创立以来，这家公司已经完成了超过15亿美元的融资，投资方包括微软、英伟达、Google前CEO埃里克·施密特等。Inflection公司的核心产品聊天机器人Pi主打的不是生产力工具，而是面向个人用户的、带情感的聊天伙伴。此外，Inflection公司也面向少量合作方提供API产品。Suleyman没有公布今年5月上市的Pi的用户量，只表示「它非常受欢迎，留存率很高」。

新模型的训练已经提上日程，规模要大100倍

Inflection与英伟达、云计算服务公司CoreWeave合作开发、集成了2.2万枚H100芯片的计算集群或许是其最重要的资产，它超过了Meta此前公布的由1.6万块GPU组成的集群。Inflection公司表示，计划全量使用这个2.2万枚H100芯片构成的集群训练更大规模的模型。

Suleyman称，预计下一个模型的规模将在6个月内达到前代模型的10倍，并在后续6个月的时间里继续10倍成长——也就是模型规模在未来一年内扩大100倍。

参考链接

https://inflection.ai/inflection-2

https://www.forbes.com/sites/alexkonrad/2023/11/22/inflection-ai-releases-2nd-model-on-gpt-4-heels/

DeepMind推出能玩多款棋牌游戏的模型——Student of Games

刊登在《科学进展》期刊上的最新论文显示，DeepMind开发出了一种名为Student of Games（SoG）的新AI，可以在国际象棋、围棋、扑克和其他需要多种策略才能获胜的游戏中击败人类玩家。

SoG结合了两种AI

科学杂志《新科学人》采访到了论文作者之一、曾在DeepMind公司从事AI工作的Martin Schmid，他目前已经离开DeepMind，在一家名为EquiLibre Technologies的初创公司工作。

Schmid表示，SoG模型可以追溯到两个项目，其一是由Schmid等人在加拿大阿尔伯塔大学读书时开发的AI DeepStack，它是首个在扑克游戏中击败人类职业玩家的AI；其二是DeepMind公司开发的AlphaZero，它在国际象棋和围棋等游戏中击败了最优秀的人类棋手。

这两种AI模型的区别在于，一种专注于不完美知识游戏，即玩家不知道其他玩家的状态；另一种专注于完美知识游戏，例如国际象棋，玩家可以随时看到双方所有棋子的位置，因而两者需要根本不同的方法。DeepMind聘请了整个DeepStack团队，合作开发一种可以泛化两种类型游戏的模型，也就是现在的SoG。

最初，SoG作为学习游戏策略的「蓝图」，通过练习持续改进。而后，这个入门模型可以在不同的游戏中自由发挥，并训练自己与自己的另一个版本对战，学习新策略并逐渐提升性能。

相比之下，DeepMind旗下的AlphaZero只适应围棋这样的完美知识游戏，SoG则可以同时适应完美和不完美知识游戏，因而具有更强的通用性，但在特定游戏的性能方面相对弱于AlphaZero。

DeepMind开发了这些游戏AI

·2017年10月，开发AlphaZero，不采用人类玩家的棋谱，而是通过自我对弈，超越了AlphaGo Lee、AlphaGo Master等旧版本；

·2019年1月，开发AlphaStar，在《星际争霸2》击败了职业选手TLO、MaNa；

·2020年12月，开发MuZero，在不告知游戏规则的情况下，让它通过观察大量游戏和棋类比赛来掌握围棋、国际象棋、日本将棋等规则，在国际象棋、围棋和日本将棋上达到了与接收过完善规则的AlphaGo相同的水平。

参考链接

https://www.science.org/doi/10.1126/sciadv.adg3256

-END-

我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。

和每一位关心技术、关注人类命运的读者一样，我们希望在这个充满不确定性的时代，更好地理解快速变化的科技世界，也更好地理解生而为「高级智能」的我们自己。

在这个目标下，我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意，我们说的智能，不只是 AI。

若想了解更多本周资讯，请点击阅读往期智能周报：

智能周报｜生成式AI的两难

与记者交流，可添加微信（请备注公司名称和姓名）：

王杰夫微信号: wjfsty

张司钰微信号: helianthus351

吴洋洋微信号: qitianjiuye

本文版权归第一财经所有，

未经许可不得转载或翻译。

识别下图二维码，

即可购买《第一财经》杂志2023年11月刊

继续阅读

阅读原文