智能晚报｜字节跳动测试多个类ChatGPT产品；稚晖君发布人形机器人「远征A1」和控制系统WorkGPT；OpenAI首次收购

「每周一三五更新」

撰文：张司钰

编辑：吴洋洋

Key Points

OpenAI收购游戏公司Global Illumination

稚晖君发布人形机器人「远征 A1」和控制系统WorkGPT

字节跳动测试类ChatGPT产品「豆包」

加入AI功能后，微软的搜索引擎Bing没怎么增长

Meta将推出编程AI模型Code Llama，同样会开源

OpenAI收购游戏制作公司Global Illumination

8月16日，OpenAI宣布已收购初创公司Global Illumination，目前该公司整个团队已加入OpenAI，参与包括ChatGPT在内的核心产品的开发。

Global Illumination是什么公司？

Global Illumination成立于2021年，专注于开发与在线游戏制作相关的开源技术，团队仅有8人，来自Facebook、Instagram、YouTube、Google等公司，其中，首席执行官Thomas Dimson曾任Instagram工程总监。

目前，该公司唯一的产品是基于Web的沙盒类大型多人在线角色扮演游戏Biomes，被称为开源版《我的世界》，玩家只需要打开浏览器，就可以建造、觅食、玩小游戏以及参与更多活动。游戏使用AI技术，根据玩家的行为和喜好，生成并调整地形、植被、动物、天气等。

Biomes游戏界面

为什么收购这家公司？

这是OpenAI首次公开收购，交易的条款尚未透露。不过，OpenAI收购Global Illumination可能意在智能体（Agent）的研发。

沙盒游戏（Sandbox Game）是一种电子游戏类型，它在游戏中提供了开放式的、自由度高的世界，让玩家可以在其中自由探索、创造和互动，而不受严格的预设目标限制。这种游戏类型得名于儿童在沙箱中玩耍时的自由创造性。

这种游戏相当于为AI提供了一个开放性的训练场景，有利于收集大量人机交互数据，在完成复杂任务时帮助构建更先进的GPT。

智能体与普通聊天机器人（比如ChatGPT）的区别就在于，其具有更强的推理能力，能够将复杂任务拆解成多个小任务，然后调用相应软件、数据或者其他AI模型的API接口，逐一完成这些小任务，从而整体上完成一个复杂任务。

相较而言，目前的ChatGPT无论在拆解复杂任务，还是将为小任务生成代码去调用其他程序的能力上，都准确性不足。更强大的基础模型——比如GPT-5可能有助于解决这一问题，但仅仅基于语言训练可能不足以使其推理能力到达这一点——玩点游戏可能更有帮助。

微软此前也在积极收购游戏公司动视暴雪。

智能体（Agent）正在成为生成式AI领域的新热点

新皮层曾报道过的AI小镇（SmallVille），它由斯坦福大学和Google研究部门联合开发，以及美国人工智能初创公司Simulation用多个人工智能重拍的连续剧《南方公园》（South Park）、清华大学NLP实验室孙茂松教授带队用10多个聊天机器人开发的五子棋小游戏，都相当于将生成式AI训练成一个个可以独立决策的智能体，相互合作共同完成一项任务。

不过，这些项目中都有不少的工程师介入，并非完全交给AI去决策，也就是说它们距离真正的agent还有些距离。

沙盒游戏Biomes体验链接：

https://www.biomes.gg/

参考链接：

https://openai.com/blog/openai-acquires-global-illumination

稚晖君发布人形机器人「远征 A1」和控制系统WorkGPT

8月18日，稚晖君的创业公司发布了第一款产品人形机器人「远征 A1」。

稚晖君是谁？

稚晖君本名彭志辉，毕业于电子科技大学，他2020年加入「华为天才少年计划」，负责华为昇腾计算产品线的全栈研发。此前，彭志辉就职于OPPO研究院AI实验室，任算法工程师。

去年12月27日，彭志辉发帖表示将离开华为，投身机器人创业项目。

「远征 A1」长这样。

今年2月27日，智元机器人关联公司上海智元新创技术有限公司成立，彭志辉参与创立。这家公司的业务时发展通用人形机器人和具身智能。公司成立三个月后便完成了第三轮融资，估值超10亿美元，成为独角兽公司。李彦宏旗下三亚百川致新私募股权投资基金、鼎晖、经纬、高榕等均有参投。

「远征A1」的硬件

远征A1是一个人形机器人，其身高175cm，重53kg，最高步速可以达到7km/h。此外，它可以承重80kg，单臂最大负载5kg，相当于可以用一只手臂举起一袋常规体积的面粉。

特斯拉的「擎天柱」长这样。

远征A1是一款面向工业制造领域的产品。目前常见的机器人，比如小米的人形机器人「CyberOne」，只有21个自由度，但远征A1全身有49个自由度，可以完成汽车生产过程中整理线束、拧螺丝、总装等任务。并且，机器人的全身可以模块化组装，比如把机械手换成螺丝刀，或者把腿变成轮式。

小米的「CyberOne」长这样——你分清楚了吗？

彭志辉称，远征A1的硬件系统基本由公司自主研发。比如功率高、不需要传感器、价格低的关节PowerFlow，它可以帮助机器人膝关节向后弯曲，从而更高效地完成任务。再比如指尖安装传感器、有12个主动自由度、5个被动自由度的机械手SkillHand。

「远征A1」的软件

「远征A1」基于的模型被称为「WorkGPT」。这是一个囊括了多个模型在内的智能体模型，其内部包括一个类似ChatGPT的语言模型、一个视觉控制模型以及其他用于本体控制、感知等在内的模型。其中，视觉控制模型为智元自研，语言模型来自对百亿参数开源模型的调优，能过为机器人提供理解任务、编排动作的能力，它相当于机器人的大脑——你可以不用告诉机器人什么是垃圾，它就能自己分辨出来。

WorkGPT不止要Chat，还要Work。

发布会上，彭志辉表示，希望将整机成本控制在20万元以内，并将以此为基础推出第一代商用产品。

除人形机器人之外，智元机器人还做什么？

EI-Brain具身智脑框架：该框架中的机器人系统被分为不同层级，包括部署在云端的超脑，部署在端侧的大脑、小脑以及脑干，其中，「大脑」负责抽象思考与多位推理，「小脑」控制运动指令生成，「脑干」负责电机控制等底层硬件。这套系统可以连接云端以实现复杂任务调度，电机控制等任务则可以在本地完成。
动作库平台：该平台用于离线轨迹优化。
未来还将搭建一个开放平台：包含整个机器人的开发套件、一些预训练大模型，以及为开发者提供资金奖励和合作机会。
参考链接：
https://mp.weixin.qq.com/s/cgfbJgl9enzGXGTb6q6FGA

字节跳动测试类ChatGPT产品「豆包」「小宁」等

8月18日，字节跳动大模型对话产品「豆包」开放测试，用户可通过网页或者下载 App体验。

「豆包」是什么？

「豆包」是字节跳动研发的大模型对话产品，具备自然语言处理、知识回答、语言翻译、文本摘要、情感分析等功能，其训练数据截至2023年。「豆包」还处于早期开发验证阶段，目前只是小范围的邀请制测试。在展示案例中，「豆包」可以生成健身计划、心理学书籍、奇幻小说开头等。

「豆包」的问答表现。

除聊天机器人「豆包」外，同一测试页面还出现了其他各种AI助手，包括「英语学习助手」「全能写作助手」「超爱聊天的小宁」等。其中「全能写作助手」主要负责生成电影评价、视频脚本、诗歌或歌词；而「小宁」则更侧重聊天。

这个路线类似于Meta，后者也曾计划推出一系列不同性格的机器人。

字节家最爱的产品矩阵。

字节跳动的大模型进程

今年2月，字节跳动已经在大模型上有所布局，聚焦语言和图像两种模态，其中语言大模型团队在今年组建，由字节搜索部门负责；图片大模型团队则由产品研发与工程架构部下属的智能创作团队负责，均向Tik Tok产品技术负责人朱文佳汇报。不过在当时，虽然技术中台有所探索，但还处于初期阶段。
今年3月，阿里达摩院AI大模型M6的前主要负责人杨红霞加入字节跳动AI lab，参与语言生成大模型的研发，向字节跳动副总裁杨震原汇报。
4月11日，飞书宣布将推出AI助手「My AI」，可以自动生成会议纪要、撰写报告、润色文本，用户还可以通过与其对话，创建日程、搜索公司内部知识库；
4月18日，字节跳动旗下的云计算平台「火山引擎」推出大模型服务平台「火山方舟」，引入百川智能、IDEA研究院、MiniMax、智谱AI等人工智能公司的大模型。
「豆包」测试链接：
https://www.doubao.com/

Bing AI没有带动微软搜索市场增长

据《华尔街日报》8月18日报道，分析公司StatCounter和Similarweb最新报告显示，7月，微软旗下的搜索引擎Bing占据搜索市场的份额仅为3%，且月度用户量仅为Google的1%，这与1月搭载ChatGPT的Bing AI推出前情况基本一致。生成式AI对微软搜索引擎市场份额提升看起来没有太多帮助。

微软对分析公司的数据提出异议

微软称，第三方研究人员没有统计对Bing聊天的所有访问。

今年2月，微软在推出Bing AI时，公司高管在与分析师的电话会议上表示：「搜索广告市场的份额每增加1个百分点，我们的广告业务就有望增加20亿美元的收入。」

不过，搜索业务一直都不是微软的核心业务

虽然微软的广告业务主要来自Bing，但其占总收入的比例不到6%。7月末公布的2023财年第四财季业绩报告中，包括Office 365软件在内的生产力和业务流程营收同比增长10%，但被视作未来业绩增长引擎的Azure云业务增速放缓，这一轮AI热潮也没有给云业务带来显著的增长。

参考链接：

https://www.wsj.com/tech/ai/microsoft-bing-search-artificial-intelligence-google-competition-6e51ec04

Meta将推出编程AI模型Code Llama，同样会开源

据The Information 8月18日消息，Meta计划推出帮助开发人员自动生成代码的开源软件，其模型名为Code Llama，基于开源大语言模型Llama 2，该模型最快将在下周发布，并计划开源。

今年5月初，Meta已在内部推出一个AI辅助代码生成模型CodeCompose，其功能与GitHub的Copilot类似。目前尚不清楚Code Llama是否与CodeCompose有关。加上之前推出的Llama和Llama 2两代大语言模型，Meta已经推出了至少3个开源模型。

-END-

若想了解更多当日资讯，请点击阅读往期智能晚报