“一夜变天”，ChatGPT奇迹也将发生在机器人领域

机器之能报道

编译：吴昕

条条大路通罗马（AGI），虽然方式不同，但我们可以期待非具身 AGI 和具身 AGI 大致同时出现。

。昨天，一直在 X 平台比较活跃的 1X AI 副总裁 Eric Jang 写了一篇文章，公开了其对AI 和机器人技术发展方向的一些预测。两年前，谷歌高级研究科学家 Eric Jang 离开 Google Robotics，加入 1X Technologies（原名 Halodi Robotics）负责 AI 工作。从那时起，AI 领域发生了很多事情，他也一直在思考 AI 之路将通往何处。

“

许多 AI 研究人员仍然认为通用机器人还需要几十年的时间。但请记住，ChatGPT 的发生几乎就在一夜之间。

”他在昨天的文章中写道，“

我认为，这也将发生在机器人技术上。一旦发生这种情况，计算本身将彻底改变

。”

“最终，所有 AI 软件都会融合起来,看起就像机器人软件。”

1X 人工智能副总裁 Eric Jang接受播客节目的采访，讨论AI和人形机器人技术的发展前景，包括为什么现在是投资和建造通用机器人的最佳时机。

文章不算长。Eric Jang 首先谈到 1X AI 团队完成的两项重要工作，这些成就让他“非常自豪”。一个是通过端到端的神经网络，实现了人形机器人 EVE 的自主性。在这些视频中，EVE 掌握新技能都不用专业人士写代码，而是直接从数据中学习。这意味着未来扩展机器人能力的门槛大为降低——不用再受雇用专业人士以及他们撰写代码速度的限制。

随着时间推移，机器人功能会越来越受数据驱动，同时对专业知识的依赖性越来越低，这种机器人技术将更容易被更多没有技术背景的普通用户所接受。

“据我所知，1X 是第一家让数据收集系统自我培训的机器人公司。” Eric Jang 提到第二个让他骄傲的成绩。EVE 机器人透过数据来理解世界，因此，如何收集和管理训练数据比算法模型重要得多。为此，他们将 Meta VR Quest 头显设备变成了机器人的 AI 训练数据采集系统，并投入大量资金和人力提升数据质量。比如，一些没有机器学习背景的人也可以用自己收集的数据微调基础模型，从而领悟如何收集更高质量的数据。

公司的运维团队（无需专业的机器学习背景）自行教会机器人一些行为。

“这个办法确实缩短了收获良好模型的时间，因为收集数据的人可以非常快速地获得反馈，了解他们的数据有多好以及实际需要多少数据来解决机器人任务。”Eric Jang 预测，“这将成为未来收集机器人数据的普遍范式。”

公司的运维团队（无需专业的机器学习背景）自行教会机器人的一些行为。

1X、Figure、特斯拉等公司的技术路子都是一样的—— 建立完全通用的硬件、软件，应对各种现实案例。当然缺点是从来没有人解决过这个问题，但潜力无穷。这和当今大多数机器人公司提供价值的方式也完全不同。无论是叉车、割草机、扫地机还是焊接、喷涂或者拾取包裹的工业机械臂都是从一个很窄的领域开始，垂直整合硬件和软件，从来没有真正突破自己的利基市场走向通用领域。

现在，Eric Jang 和同事们正雄心勃勃地扩展模型，也发现机器人公司与 LLMs 公司所面临挑战有很多相似之处。他非常赞同一位同行的观点，“

所有 AI 软件都将融合到机器人软件中

”。或者说，所有 AI 软件最终都会融合起来，看起就像机器人软件。

他谈了一些观察和论据。当和那些思考职业发展的 AI 研究人员和工程师聊天时，他发现机器人领域往往不是这些人才的首选。原因也不难猜，过去机器人业务的成绩单乏善可陈，公司死亡率居高不下，未来也可能继续如此。更何况，现在有一大把更容易拿到投资的选择，比如聊天机器人、生成式 AI、颠覆搜索、智能助理、重新发明操作界面等等。

Eric 承认，在纯软件环境中部署机器学习更容易，因为比特（数字）世界是可预测的。机器人要和原子构成的物理世界打交道，所有外部信息都是未知的。你不知道你在哪里，其他东西在哪里，如果你接触到什么会发生什么（按下开关，灯是否亮？你甚至根本不知道是否按下了开关）。即使一些非常琐碎的事情，比如区分坐电梯下降和乘龙门吊上升都很困难，因为在惯性测量单元( IMU )传感器的眼里，这些力都很相似。区分不了的机器人最终会躺在地板上抽搐，因为它认为自己还有机会保持平衡。

但这种分别不应被过度强调。当 AI 软件开始接触现实世界时（比如用 LLMs 驱动的助手叫 Waymo），面临的挑战难度并不亚于机器人也很相似——应用程序与熵源交互时间越长，就更难保证程序行为正确性。“即使你没有造一个物理意义上的机器人，但你的代码库最终看起来就像一个现代机器人软件栈。” Eric 写道，还举了一些例子。

比如，他本人花了相当一部分时间在这些 LLMs 也会熟悉的工作上——确保数据加载器、日志管理平台的可扩展性，上传数据时确保可以将这些数据按 transformer 的时间因果序列排序。他还设计了一张表格，列举了机器人和 LLMs 所面临的类似挑战。

这张表格列举出了机器人和 LLMs 所面临的类似技术挑战

所有这些问题都很棘手，但并非不能解决。“尽管大多数 AI 公司和实验室不必考虑执行器硬件、电磁干扰或快速移动躯体带来的安全隐患，但机器人+研究过程中的工程技能，将是未来所有软件非常不可或缺的一个方面，而不仅仅只有控制机器人才需要。” Eric 写道。

如果你接受这样一个前提—— LLMs 和机器人面临类似的工程和基础设施挑战，“那么，我们也可以期待非具身 AGI 和具身 AGI 大致同时出现。硬件这部分已经准备好了——就在过去 10 年发表的研究论文中。

”

“许多 AI 研究人员仍然认为，通用机器人还需要几十年的时间。但请记住，ChatGPT 似乎是在一夜之间发生的。

我认为，这也将发生在机器人技术上

。一旦发生这种情况，计算本身将彻底改变。”

除了 AGI，Eric Jang 正在研究的主题之一还包括利润——如何将 1000 万美元 GPU 投入转化为 1000 万美元以上的利润。过去两年中筹集了千万甚至上亿美元、从头开始训练自己 LLMs 的初创公司都支付了巨大的成本，而现在基本上每个 AI 初创都能免费获得一些资源。“

我认为，绝大多数成功的创业公司都能灵活地驾驭开源的潮流

。”

“当然，我并不是说大胆下注训练 AGI 不是一个好主意；我只是认为，最适合这条路子是那些能将计算成本降到最低的公司。”否则的话，还是请严格遵守与能力相关的扩展定律和指标。“许多初创公司都在关注谷歌如何将在 Rankbrain 上投入的几十亿研发成本变成好几倍的利润，但他们也忘记了，这首先需要建立谷歌搜索业务。”

除了 GPU 的昂贵，Eric 也感慨当下人才成本之疯狂。“我曾与博士生交谈过，他们要求 7 位数的薪水。”这个数字让他想起六年前听闻 Open AI 联合创始人 John Schulman 薪水有 275k 时的感觉。

最后，Eric 预测 “ 这一代自动驾驶汽车公司将在未来几个月出现很多变化。同时，

没有比现在更好的时机来创办一家全新的自动驾驶公司了

。”

参考链接

https://evjang.com/2024/03/03/all-roads-robots.html

转载请联系本公众号获得授权

投稿或寻求报道：[email protected]

继续阅读

阅读原文